问答对话式分析=自然语言生成图表吗?漫谈ChatBI是不是伪需求

业务团队的目标不是分析数据、不是拖拉拽,而是获得支撑业务决策的答案。甚至不必考虑如何将业务问题转化为数据问题,他们应该简单地提出问题并得到答案。


大模型出来以后,用自然语言的方式做数据分析(有人称为ChatBI)成了数据界关注的重点。

有研究机构说:数据分析天然就是大语言模型/对话式AI落地的合适场景。也有企业在探索了一段时间后,认为这是个没什么价值增益的伪需求。

诚然,自然语言界面能够显著降低人与数据交互的门槛,不过在谈是不是伪需求、是不是有价值之前,还是应该聊聊对话式分析要解决“哪些人”、与数据“如何交互”的问题——先说为了谁,再说怎么做。

– 01 –

开始之前,不妨回忆一下经典的数据分析工作流程。

从业务团队的视角来看,数据分析最好足够“简单粗暴”:业务方提出一个业务目标,最终得到一个能够支持业务决策和行动的数据洞察报告。

事实上在这个从问题到答案的过程中,充满了协作、沟通和大量水面下的工作。

输入:业务目标e.g. 营收增长2倍业务团队
业务分析– 评估需求合理性- 拆分达成目标的影响因素- 确认数据口径……数据团队业务团队
数据分析– 分析指标,发现和业务问题相关的范式和趋势等数据团队
数据报告– 数据可视化- 搭建看板、报表数据团队
数据解读– 提炼洞察,说明关键发现和行动建议,形成报告数据团队
内化理解– 理解数据报告业务团队
输出:业务决策– 落实业务行动业务团队

可见,在传统的数据分析工作流中,业务团队是不直接和数据接触的,他们依靠与数据团队反复沟通,将业务需求转化为可量化分析的内容。

而数据团队的工作则可以大概拆解成如下环节:理解需求,验证问题,识别相关的影响因素,分解为量化指标,形成假设,取数,建模计算,结合业务阐释数据……

事实上一个数据分析师80%以上的时间是在理解需求、拆解需求,写代码、做看板只是最终呈现出来的冰山一角。

– 02 –

今天,当我们想用AI工具来赋能业务人员自助分析的时候,就不可避免要弥合业务和数据两个团队在专业技能和认知层面的gap。

在技术层面,业务团队没有代码或使用BI工具的基础。过去,企业寄希望于组织内部培训,事实上效果不佳,无论是学习意愿还是学习效果,都难及预期。

在认知层面,培养数据分析思维、学习各种统计知识的难度不亚于学习工具。更重要的是,如果不具备分析思维,用户可能无法提出一个符合正确分析范式的问题,更遑论用BI工具解决了。

这也是过去几年里,敏捷BI、自助BI始终无法真正被业务人员广泛采用的原因。

业务团队的目标不是分析数据、不是拖拉拽,而是获得支撑业务决策的答案。业务团队甚至不必考虑如何将业务问题转化为数据问题,他们应该简单地提出问题并得到答案。

TDWI调研欧美企业,过去10年间BI工具的留存率一直徘徊在18%-24%之间;根据北极九章的客户访谈,国内的这一数字会更低。

– 03 –

回到开头提到的问题:对话式的数据分析,就是自然语言生成数据图表吗?

我们的答案是:可以是,但又不只是。

如果是面向能够自主理顺分析思路、把控分析方法的专业人士,一个BI Copilot/代码Copilot用自然语言生成图表,就可以帮他们提升效率,节省一些拖拉拽的时间。

而面向数量更多的非技术用户,当他们不知道如何拆解业务问题、不知道如何深入挖掘数据的时候,仅仅是一问一答获得一张图表,还远远不足以支撑这些用户做出业务决策。

回顾经典的数据分析流程,我们发现,真正想要实现业务人员自助分析,需要的是用AI来自动完成从业务分析到数据解读的全流程,而自然语言生成图表只是其中一个环节。

在这个前提下,要解决的就不只是“人类语言翻译成机器语言”的问题(当然,这是一个很关键的问题,翻译是否准确、语义理解是否灵活对产品的可用性至关重要),对话式分析产品需要理解用户的问题意图,并且自动拆分、拓展、挖掘问题,甚至做出合适的可视化展现,并提炼出数据中的关键发现,汇总到一起呈现给用户。

北极九章正在做的就是这样一件事。

利用AI技术和深耕数据分析行业多年的专家经验,还原3-5年经验数据分析师的技能和思路,让业务用户通过一个简单的自然语言提问,就能从纷繁复杂的海量数据里一步直达数据洞察。无论是快速验证业务结论,还是探索数据头脑风暴,都可以在电脑上、手机上随时打开,与AI对话。