2024年5月30日,在中国信通院组织的首批大模型驱动的智能数据分析工具专项测试中,基于蚂蚁百灵大语言模型的蚂蚁大数据产品DeepInsight顺利完成了专项测试的全部内容,成为首批完成此项测试的企业。
《大模型驱动的智能数据分析工具》 标准及测试简介
中国信通院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合50余家企业的100余位专家共同编制完成了《大模型驱动的智能数据分析工具》标准。标准包含数据准备能力、大模型智能分析能力、智能交互能力、分享协作能力、集成部署能力、安全管理能力等六大能力域,18个能力子域,54个能力项。基于此标准的测试活动,火热报名中。
蚂蚁大数据产品DeepInsight 产品介绍
基于蚂蚁百灵大语言模型的蚂蚁大数据产品DeepInsight是蚂蚁金服大数据团队的智能数据分析产品,持续服务蚂蚁集团和阿里集团及其生态用户有7个年头了,在这个过程中持续迭代升级产品能力,随着智能化时代的到来,DeepInsight基于蚂蚁百灵大语言模型,通过构建用于不同数据分析任务的Copilot和Agent组合,帮助企业大范围的业务和非技术人员通过自然语言对话,低门槛的定义复杂指标、取数和分析获取洞见、智能化的对数据进行解读和生成报告,从而提升用户的决策效果和效率,实现用户数据分析的智力平权、能力平权、效率平权。
DeepInsight智能化产品目前已经实现4个Copilot:
1. 报表制作Copilot:制作报表的用户,可以通过自然语言构建低门槛的定义指标、生成图表、修改图表配置,同时也可以基于LLM+业务知识生成看数思路,自动生成报表。
2. 报表阅读Copilot:阅读报表的用户,在阅读某个报表过程中,可以通过自然语言基于对图表中的指标继续定义衍生指标、取数、分析、生成摘要和解读等,挖掘报表上未展示的规律或者异常。
3. 知数据Copilot:关注某个业务场景的用户,需查看这个业务场景所有的资产(指标、报表等),可以通过自然语言搜索感兴趣的资产,并且通过自然语言对指标进行取数、异常分析、归因分析、预测分析等,进行多个资产联合分析,挖掘资产内部、资产之间的规律或者异常
4. 自助分析Copilot:需要构建看数思路的用户,对原始数据进行探索:包括指标定义、取数、分析、知识问答等。
作为一个服务蚂蚁和阿里用户近10年的数据分析洞察产品,蚂蚁大数据产品DeepInsight优势源自持续不断地技术创新和突破:
1. 自然语言取数正确率已达到支持业务场景大规模应用的标准:我们构建大量数据分析场景的训练语料(SST语料、SFT语料、Shotting Examples等等),然后基于蚂蚁百灵大语言模型进行实验、验证,同时在工程上增加多种代码生成的校验和修正策略,实现了取数、度量定义这2个最常用任务的端到端自然语言指令执行,在单轮对话中正确率达到95%,多轮对话中达到85%,远高于业界基于Text2SQL方案的效果。
2. 设计数据分析领域的复杂多轮对话系统,其中的数据分析意图识别准确率超过96%:通过设计数据分析领域多轮对话的Shotting、SFT的训练集及评测集,进行了大量的实验,训练了面向数据分析领域专用的LLM模型,基于这个模型实现了可复用于各业务类型的、数据分析自然语言理解方案。
3. 数据分析领域创新的多模态产品交互方式:用户可以通过自然语言和可视化交互操作,进行可视化和自然语言无缝的联动操作,当前国内竞品无一能实现类似产品体验(该产品体验在国内有2-3年的领先)。
4. 同时还有一系列的技术创新还在实现过程中:
a. 如:基于推理语言+大语言模型的数据分析规划器、基于指令+大语言模型的的规划器 能够自动生成分析思路,进一步降低复杂分析任务的门槛。
b. 又如:基于传统规划的HTN+大语言模型实现数据科学思路的DataInterpretor,降低数据科学的门槛。
基于已实现的创新能力,DeepInsightCopilot已开始在内部开始大规模推广,属业界第一个大规模推广且有大量用户使用的智能化BI产品,将会为企业数据驱动决策的竞争力提升到新的层次。
蚂蚁大数据产品DeepInsight 典型应用场景
对于数据分析师来说,DeepInsightCopilot 的推出解决了用户日益增长的取数与分析需要 和 当下产品能力 存在较大GAP,导致很多需求不能被承接、或者响应时间长达一周,影响业务发展的矛盾。
1. 通过DeepInsightCopilot的复杂指标定义功能,让非技术用户可以定义复杂的业务指标,不需要找资产研发同学写SQL研发ADM资产。
基于面向数据分析场景训练的LLM,可以让复杂指标定义的门槛降低为日常提需求一样。
例如:通过自然语言定义一个“GMV”指标
基于”GMV指标再定义一个复杂的衍生指标:
1. 通过DeepInsightCopilot的取数功能,让非技术用户可以自助的通过自然语言取数,同时让数据分析师不再受临时取数需求的干扰,可以专治于对业务价值更大的专题分析思路构建。
例如:
用户第一次提问查询指标,
然后第二次提问 增加分组条件,此时提问只需要 和日常对话聊天一样,表达自己希望 下钻的维度就可以了
1. 通过DeepInsightCopilot的分析功能,让非技术用户可以自助的通过自然分析指标为什么上涨、下跌。
基于LLM和算法的智能分析方案,解决了使用NL2SQL进行多维分析无法挖掘数据背后隐藏的规律,为用户提供基于自然语言来发现指标异常、归因、预测的增强分析能力,大幅降低高阶数据分析门槛。
蚂蚁金服大数据产品DeepInsight作为国内首批将大模型技术应用于企业级商业智能分析的服务商,以最高分通过此次测评,标志在数据分析领域达到新的高度。展望未来, 蚂蚁大数据产品DeepInsight将不断探索大模型与数据分析技术的深度融合,通过世界领先的智能化的数据技术和产品能⼒帮助企业做好数字化转型和升级,实现企业在数字化上的遥遥领先,这也是我们⽮志不渝的⽬标。
目前,中国信通院“大模型+数据智能应用”系列测试火热报名中,欢迎联系咨询!
《大模型驱动的智能数据分析工具技术要求》(已完成,开放测评)
《大模型驱动的智能知识图谱技术要求》(已完成,开放测评)
《检索增强生成(RAG)技术要求》(已完成,开放测评)
《大模型驱动的智能知识问答系统技术要求》(已完成,开放测评)
联系方式
联系人:韩老师
联系电话:18627873252(微信同号)
联系邮箱:[email protected]
中国通信标准化协会大数据技术标准推进委员会(CCSA TC601,简称:数标委/BDC),旨在凝聚产业链各个环节,识别和解决大数据发展面临的重大问题,开展大数据技术、数据资产管理、数据共享与流通、数据安全等共性基础标准研究,以标准推进工作为纽带,推动大数据与实体经济深度融合。欢迎加入我们的行列!
入会咨询:白老师 13520285502
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...