此篇文章发布距今已超过190天,您需要注意文章的内容或图片是否可用!
2024年5月8日下午,由中国信通院云计算与大数据研究所、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)共同发起的“检索增强生成(RAG)实践分享沙龙”成功举办!行业专家进行了精彩分享,沙龙直播观看共达6000余人次。本次会议由中国信通院云计算与大数据研究所牵头组织,邀请了来自腾讯云、中国科学院计算机技术研究所、观远数据、仪电智慧城市设计研究院、朗坤苏畅的专家深入探讨了检索增强生成(RAG)技术实践经验和发展趋势。中国信通院云大所韩晓璐主持了本次沙龙。韩晓路|数据智能时代检索增强生成(RAG)技术发展趋势及相关标准化工作介绍
中国信通院云计算与大数据研究所工程师韩晓璐介绍了信通院在数据应用、数据智能方面所做的工作,探讨了数据智能时代大模型落地应用关键技术检索增强生成(RAG)发展趋势,并发布了《检索增强生成(RAG)技术要求》标准。随着数据智能技术的不断发展,以大型语言模型 (LLM) 为代表的内容生成技术已经成为企业数据智能能力中不可或缺的一部分,但传统的内容生成技术存在信息更新不及时、垂直领域知识匮乏、模型幻觉等问题,而检索增强生成 (Retrieval-Augmented Generation,RAG) 技术则为此提供了有效的解决方案,成为数据智能时代的一大趋势。检索增强生成是一种通过检索外部知识库来改进内容生成效果的技术方案,通过引入检索过程,从预先构建的数据存储中检索相关的内容,能有效地缓解大模型幻觉问题,提高知识更新速度,并增强内容生成的多样性和可追溯性,使其在实际应用中变得更加实用和可信。在此背景下,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601),联合50余家企业的100余位专家共同编制完成了《检索增强生成(RAG)技术要求》标准,标准包含知识库构建能力、知识检索能力、内容生成能力、质量评估能力、平台能力等5大能力域,19个能力子域,50余个能力项。基于该标准的首批评估测试火热报名中,,首批证书将在6月19日数据智能大会颁发,欢迎报名参与!
腾讯云大数据ES产品负责人任翔介绍了Elasticsearch(简称ES)在RAG的解决方案、优势及相关实践。嘉宾首先回顾了搜索技术演进历史,AI大模型崛起对企业的价值和挑战,以及RAG如何帮助企业成功将私域知识库和大模型结合。然后嘉宾重点介绍了ES在RAG领域的解决方案,包括一站式完成向量生成、存储/索引、向量检索,大幅度降低企业算法工程接入复杂度和成本,集成 LangChain,帮助构建复杂的数据管道和生成式 AI及LLM大模型集成。和传统向量数据库比较,ES不仅负责向量的生成、存储和搜索,还提供更多丰富能力,如混合搜索、模型选择和部署,聚合、权限管理等。接下来,嘉宾介绍了腾讯云ES在RAG领域的能力增强,包括支持专有机器学习节点、支持自研GPU,通过对ES内核分片架构、块存储优化,和查询并行化,lucene查询缓存锁等改造,查询性能提升3-10倍。最后,嘉宾以一个用户规模过亿的在线读书平台为例,介绍了RAG在大规模数据应用的落地方案和为企业在开发效率、运维投入、准确率、查询效率、存储成本、稳定可靠方面带来的价值。中国科学院计算技术研究所的副研究员范意兴分享了基于搜索增强生成的智能信息助手探索与实践。首先,介绍了大模型为信息获取从信息检索到信息助手转变带来的新机遇,包括输入形式、交互方式以及结果形态的变化;接下来,分析了基于RAG构建智能助手面临的三个核心挑战,包括检索相关性与有用性之间差异的挑战、大模型生成信息不可溯的挑战、以及长序列答案难评估的挑战。进一步的,分享了他们在文档有用性判断、引用增强的可溯源生成、知识注入的底座模型增强、以及RAGEval开源评估工具等工作进展。最后,还介绍了所研制的智能助手GoMate的系统架构和能力特色,并分享了在RAG系统中从离线文档索引阶段、文档检索与压缩阶段、以及结果生成与验证阶段来提升系统可靠性的经验。周远|数据分析领域RAG应用实践
观远数据联合创始人兼首席科学家周远介绍了观远数据在数据分析领域RAG的实践经验。观远数据联合创始人兼首席科学家周远介绍了观远数据在数据分析领域RAG的实践经验。嘉宾先就企业如何通过ChatBI与RAG技术的结合来解决企业内部知识嵌入和复杂查询逻辑等关键问题,并对知识库构建、代码生成流程和组件选型进行了细致的分析。其次,通过对比RAG与其他技术方案的差异,分享提出了一系列创新的解决方案,如HyDE、问题改写等,以应对RAG在实际应用中的挑战。最后,嘉宾对ChatBI与RAG结合的未来趋势进行了前瞻性讨论,包括知识库的持续更新、长文本处理、系统自我提升和多模态信息融合等议题,为我们描绘了一个充满可能性的技术发展蓝图。
仪电智慧城市设计研究院资深架构师徐松林分享了大模型检索增强在标准文献领域实战的新路径。首先,嘉宾回顾标准文献的相关政策,并概述过去三年的发展情况。接下来,深入探讨RAG的典型范式,详细分享如何通过检索增强技术,将大模型与标准文献知识库相结合,构建一个高效的总体框架。在此过程中,特别强调了预处理及向量生成、利用大模型生成答案、以及Prompt工程等关键环节。此外,还分享RAG在不同阶段的增强优化探索,重点介绍自适应检索、大小模型协同,以及模型编排等先进技术。通过参考相关评估标准,并结合实际标准案例,展示了模型优化的显著成效。最后,简要讨论大模型如何赋能贯标、生成、校核、协作等一系列政务领域场景,并对未来的发展进行展望。苏畅瑶光产品负责人李勇飞介绍了瑶光大模型在工业领域RAG的解决方案、应用价值以及相关实践案例分享。嘉宾首先回顾了朗坤在人工智能技术上的发展历史,以及瑶光大模型在工业场景应用建设过程中的思考,技术方案的选择,平台架构的搭建,工业应用场景的构想。然后嘉宾重点介绍了基于RAG和企业私有知识库的大模型场景应用建设过程。如何通过企业多模态的知识数据构建知识库,如何与企业已有的系统结合构建快捷应用,如何重构企业应用的交互,从而达成在企业的技术岗位、运维岗位、管理岗位工作过程降本增效。最后,嘉宾以在核电领域实际应用为例,介绍了在产品落地过程中遇到的实际问题、解决方案以及最终给客户带来的价值。目前,中国信通院大模型+数据智能应用系列标准评估测试工作火热报名中,首批测试通过企业将在6月19日颁发证书,欢迎联系咨询! 中国通信标准化协会大数据技术标准推进委员会(CCSA TC601,简称:数标委/BDC),旨在凝聚产业链各个环节,识别和解决大数据发展面临的重大问题,开展大数据技术、数据资产管理、数据共享与流通、数据安全等共性基础标准研究,以标准推进工作为纽带,推动大数据与实体经济深度融合。欢迎加入我们的行列!
入会咨询:白老师 13520285502
[email protected]
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
ZhouSa.com-宙飒天下网
还没有评论,来说两句吧...