
DeepSeek为企业数据分析带来哪些新的机遇,又面临怎样的挑战?
北极九章创始人兼CEO刘沂鑫做客爱分析直播间,分享DataGPT与DeepSeek结合中的实践与思考。
以下为直播分享回顾。
我们和一家央企交流时了解到,他们在大年初二就被领导叫到办公室,开会研究DeepSeek,随后便开始部署,直至上线。
为什么如今大家如此青睐DeepSeek,各类企业又为何纷纷采用它呢?
关键在于DeepSeek让推理过程由模型自身实现了,即便不太会使用提示词的人,也能借助大语言模型的推理能力,将一个不太好的问题转化为优质的答案。
DeepSeek的最大价值就体现在这里:当推理能力大幅增强,同时成本又降至极低,便能在各个行业各个领域发挥出重要价值。
#01
未来的数据分析,不是BI外挂AI
说到我们的数据分析。以往数据分析严重依赖数据分析师这一职位。需要专业人员理解专业问题,把问题编写成代码,再将代码转化为数据展示,然后依据对行业的理解,输出分析报告。
今天我们也在探讨,在下一阶段,数据分析产品结合AI、结合DeepSeek该如何发展,以及如何实现这一路径。

在我们思考这个问题时,又不得不回到软件产品领域一个老生常谈的问题:我们究竟需要什么?是需要一个比现有的BI工具(如帆软、永洪、Tableau等)更出色的BI,还是更需要为业务人员提供更便捷的数据洞察和业务见解?
这其实代表了两个截然不同的产品发展方向。
💬 一个方向是在现有的软件上外挂AI,
💬 另一个方向则是将AI融入整体分析流程,借助AI的能力创造更大价值。
后者这正是我们正在努力的方向。
#02
现实很骨感:Demo容易落地难
传统的分析流程需要数据分析师在背后协助取数,并依据其对数据的理解给出建议。但如今,有了AI的助力,业务同事能够更快速地进行数据分析。
然而,在实际的企业落地过程中,我们面临着诸多挑战。
😢 我们有一个客户是国内顶尖的互联网公司,用大语言模型很快做出了一个Demo,但在实际落地时却遇到了许多问题。
🤔 这是因为大语言模型在进行数据分析时,会面临和人一样的问题。

首先,企业有复杂的数据架构,可能包含几千张表、几万个不同的维度指标、几十万个不同的词汇。当数据结构变得复杂时,即便大语言模型具备长上下文理解能力,其对输入的长上下文的理解能力也会呈指数级下降。
这就导致当企业存在多张数据表、数据口径模糊、提问者不知如何提问或者权限不足时,大语言模型往往无法准确识别。
其次,企业中存在大量大语言模型所不知道的隐藏知识。大语言模型就像一个刚进入企业的应届大学生,可能不了解企业内部特定词汇的含义。
例如,在一家车企客户,业务用户经常问“二狗的销量”,实际上“二狗”是“长城汽车哈弗大狗第二代”的内部黑话,而大语言模型可能并不知晓这一点。
此外,大语言模型在生成代码时,不会考虑执行的复杂度。例如,当被问到“上周增长最慢的10个门店”时,它生成的SQL语句可能会是一个多重嵌套的复杂语句,理论上可以执行,但由于客户的数据表规模庞大,实际执行时却无法运行。
所以,虽然在单表和少数指标的情况下,利用大语言模型能够做出不错的Demo,但在实际落地中,很多客户都遭遇了挑战。
#03
好的AI不只达到人类的标准
小马智行的CTO楼天城曾经表达过一个观点,人对AI和对人有双重标准。
👀 我们期望AI像人一样智能,但当AI仅达到人的能力水平时,我们又会感到不满。
👀 在企业中,我们从不期望一个人类员工在第一天就能理解所有的数据表、维度和指标并进行出色的分析,但我们却期望AI能够做到;
👀 我们不希望AI在取数时出错,而人犯错我们却相对能够容忍。
因此,AI仅仅达到人的能力是远远不够的,它需要在很多方面比人做得更好,才能达到可用的状态。
当前,DeepSeek-R1是优秀的推理模型,但存在严重的幻觉现象,甚至会出现输入一个数,输出的却不是这个数的情况。这是模型的天性,它本身具有灵活性,但也容易犯错。
另一个问题在于,使用满血的671B模型效果可能较好,但很多客户在部署时可能使用的是32B或70B的模型,这种情况下会遇到各种问题。
#04
为什么数据分析不能只依靠大模型?
我们需要思考,如何在需要模型输出正确数据的场景下进行控制,以及在哪些场景下让模型像人一样,通过推理和想象输出内容。
目前有两种实际的尝试。

技术路线一
第一种是大语言模型直接生成SQL,这种场景主要是为数据工程师写SQL提供帮助。
其优势在于大语言模型能够生成基础可用的SQL语句。但缺点也很明显,它高度依赖基座模型,幻觉问题无法避免,全流程是黑箱操作,权限难以管理,复杂场景无法应用。
这就导致虽然在跑Demo时可行,但在实际应用中,包括一些互联网大厂在内,效果都很不理想。
技术路线二
✌🏻 第二种尝试效果相对较好,即大模型生成结构化输出(如JSON),然后再转译为SQL。
这种方式在一定程度上可以解决权限问题和数据控制问题,但仍然存在不足。因为当大模型输出JSON时,我们只能依靠它去理解用户的问题。
而且这种方式存在“瑞士奶酪效应”,就像猫和老鼠里的奶酪一样,每一层都有一些漏洞。经过不同的调优和RAG,虽然每一层可能有80%的准确度,但多个漏洞累积起来,对于实际应用来说,会导致模型的可用性较差。
#05
DataGPT融合DeepSeek:构建精准语义与分析闭环
基于这些问题,我们在做的是融合DeepSeek,控制需要控制的场景,优化需要模型发散思考的场景。

具体来说,我们使用大语言模型做的第一件事是将句子进行翻译,类似于将中文翻译成英文。
我们北极九章有语义识别引擎,能够识别用户语义,并将我们识别的语义与大模型识别的语义进行二次校准,以确保语义的精准度。在此基础上,解析引擎会对问题进行解析,并识别用户权限。
当用户提出问题,比如询问销售额相关问题时,模型会对问题进行拆解,分析销售额的高低变化、用户的流失情况、是否存在季节性问题等。
用户的简单问题,经过我们的AI拆解成多个需要分析的问题,然后生成完整准确的问题查询代码和问题分析代码,从数据库中提取出准确的数据。再通过统计算法得出结果后,将结果反馈给大语言模型。
例如,分析业绩下滑问题,通过大模型翻译用户需求后,我们的软件执行不同的分析思路,将准确的数据和分析结果反馈给大模型。大模型基于这些数据进行思考推理,总结出营业额的情况、利润较高的日期、是否存在周期性波动等信息,并将基于数据的商业思考反馈给用户。
💎 我们采用的是混合AI模型的路线。
🎨 利用大语言模型更好地理解人的语言,将其转化为混合模型能够理解的语言,从而避免大模型的不稳定性。
🧩 同时,利用大模型具有概率性输出的特点,发挥其思考过程,输出总结和洞察。
本质上,我们与大模型的配合就如同人的左右脑分工,左脑负责计算(由小模型完成),右脑负责艺术和发挥(由大模型执行)。
#06
轻量部署:充分利用现有AI基建
我们的DataGPT可以轻松地与企业现有的IT架构和AI架构相结合。企业可以通过云API接入,或者自行部署大模型,通过接口接入我们的产品。

我们认为,企业最终可能会拥有多个不同能力的大模型,单独为一个产品部署一套大模型会过于繁重,且不利于企业未来的升级发展。
就像引入数据库一样,如果企业已有数据基础资源,就无需额外引入。所以我们希望利用企业现有的大模型资源,将其他能力和解决方法集成在我们的软件中。
🚀 对于尚未部署大模型的企业,部署小规模的DeepSeek模型就可以满足基础的需求。
💡 对于已经部署了其他大模型的企业,如我们的一家客户,最近刚从其他国产大模型切换到DeepSeek,通过API对接,我们的产品已准备就绪,企业可以直接接入使用。
#07
未来蓝图
关于未来,我们认为目前所处的阶段只是一个中间场景。
类比自动驾驶,我们已经跨越了需要专业人员使用工具的阶段。我们认为企业可能会应用更强大的大模型,我们希望成为大模型的基础设施,我们的数据分析能力可以被大模型应用,用于发现数据问题和异常。
未来,我们可能不需要人机交互,而是AI与AI之间沟通,AI发现数据问题之后,直接调用其他的AI智能体,完成更多的任务。
最后,我们希望与客户一起实现战略目标,快速在企业落地,提供可靠的产品,实现可计算ROI的价值。我们的产品大概1到2周就可以与大模型配合在客户企业中完全落地。
Comments are closed.