今天给大家分享德勤公司的报告《基于知识丰富的生成式人工智能的负责任企业决策-为什么整合知识图谱对企业级生成式人工智能至关重要?》
通过利用知识图谱和生成式人工智能的联合力量,企业可以释放知识驱动决策、创新和运营效率的巨大潜力。知识图以其结构化的领域表示,通过提供上下文、验证输出和减少偏差来增强生成式人工智能的性能,从而确保与战略业务目标保持一致。相反,生成AI通过填补知识空白和预测未来状态来丰富知识图,从而提高这些图的实用性、准确性和相关性。知识图谱和生成式人工智能之间的协同作用改变了企业的游戏规则,推动了各种组织职能的变革影响。
“我画的东西是我想象中的样子,而不是我看到的样子……”
Generative AI是一种人工智能,可以跨各种模式(如文本、图像、音频、代码、语音、视频)创建原始内容,这些内容以前需要人类技能和专业知识来创建。生成型人工智能为企业提供重要的机会,以提高其产品和服务,自动化重复任务,并创造新的和创新的客户体验。通过敏捷创建现实的模拟和场景,生成型人工智能有助于战略决策和风险管理,使其成为现代企业环境中的变革性工具。在整个行业中,我们已经确定了几个有影响力的GenerativeAI用例。生成性人工智能虽然最常与文本生成相关联,但在各种其他方式方面取得了重大进展。在图像领域,它们已被用于产生具有不同程度的真实性、可变性和创造性的图像,其中一些与真实照片是无法区分的(例如。重建事故现场以评估保险索赔和责任)。在音频领域,他们能够以自然、会话、甚至口语风格产生音乐、画外音和音频(例如:用于呼叫中心和故障排除技术人员),能够在语言、音调和复杂程度之间快速转换。在视频域中,它们可以获取用户提示并输出视频,其中场景、人和对象是完全虚构的并由模型创建(例如:营销视频展示新产品)。此外,在3D建模中,它们可以推断并生成表示复杂设计(例如:在全方位环境中创建虚拟呈现)。在代码生成中,他们可以用各种编程语言生成计算机代码,具有为人类开发人员自动总结、记录和注释代码的能力(例如:用于跨不同平台自主维护代码)。下面,我们重点介绍60个卓越的生成式人工智能应用,分为六个关键行业:
快速自信的转变(数字转换编码助理)
商业智能就在你的指尖(全系统数据搜索和访问)
修复缺失数据问题(合成数据生成)
认识你的客户(基于研究的报告生成)
增强对客户的人工智能支持(金融卫报)
个性化营销(超个性化销售和推销助理)
确保索赔的完整性(自动索赔报告)
虚拟银行体验(VR支持零售银行中心)
下一个市场分析时代(预测交易算法)
减轻风险(实时风险管理)
4.生命科学与保健
付款人、提供者和患者更快速的管理(加速优先授权)
简化索赔提交(医疗编码)
病人个性化服务(索偿助理)
医生的信息管理员(供应商内管理)
解锁疗法(新药发现/新一代)
民主化模式创建(知识领域模型开发)
优化实验程序(实验设计)
揭示规则(自动监管合规)
走向卓越的供应链(需求预测和价格优化)
5.技术、媒体与通信
客户服务对话聊天(虚拟语音客户助理)
游戏生成人工智能(游戏内容开发)
带自动化的注释(代码摘要和文件)
利用人工智能创建内容(生成性铝使能创意工具)
了解销售规则(技术销售知识管理)
营销内容倍增器(品牌出版)
大规模语文翻译(内容本地化)
流动技术员支助(电信网络维护)
加强芯片创新(半导体芯片设计与制造)
按需技术规格(外地销售助理)
6.政府与公共服务
虚拟公务员(公民参与)
全民见解(知识管理)
模拟城市规划情景(城市规划/城市未来)
教育2.0(超个性化教育)
决策数字化(政策制定助理)
起草合同和采购(服务提供)
登记个案工作者(案件管理/人力服务)
多种语文公民服务(立法行政)
当今许多著名的生成人工智能模型使用三个基本阶段:掩蔽、训练和预测。想象一下,你有一个谜题与一个句子的图片。这个拼图中有些代表单词的拼块不见了。通过掩蔽句子进行生成性AI训练就像是教机器预测正确的拼图(单词)并将其放置在正确的位置,基于它能看到的周围拼图。因此,只需简单的步骤:1.隐藏:我们在句子中隐藏一些单词(比如移除拼图)。2.训练:人工智能试图根据周围单词的上下文猜测遗漏的单词。3.预测:一旦被训练,当给出一个新的屏蔽句子时,人工智能可以预测丢失的单词。在了解了生成人工智能的工作原理之后,重要的是要注意其潜在的风险,这些风险源于这些模型的概率性质。
人工智能系统生成不基于输入数据或现实的虚假或误导性信息的相关现象。它可以以各种形式表现出来,包括产生似是而非但虚构的内容。幻觉可能带来重大风险,特别是在医疗诊断、金融或自动驾驶汽车等关键应用中,准确和可靠的信息至关重要。准确追踪和验证起源、创作的挑战过程,以及这些人工智能系统生成内容或输出的历史。生成式人工智能模型通常被视为黑盒,因为它们的复杂性和复杂的内部和可预测性使得很难预测模型将如何响应特定的输入,从而导致对潜在偏见的担忧,的不一致或不准确生成的内容。
生成人工智能的一个重要风险是,由于缺乏语义上下文,它可能产生不可靠的结果。虽然这些模型可以根据从大量数据集中学习到的模式生成内容,但它们可能并不总能掌握人类固有的更深层次、微妙的上下文。这种限制可能导致输出虽然语法正确,但可能在语义上不合适或不合适。生成式人工智能带来了与新鲜度和最新数据和响应相关的固有风险。这些风险源于人工智能模型对它们最初接触的训练数据的依赖,随着时间的推移,它们很容易过时或不准确。随着世界的快速发展,生成式人工智能可能难以跟上最新的信息和趋势,从而导致内容过时、具有误导性或不适用于当前环境。此外,当涉及到大型语言模型(LLMS)时,“语言依赖性”也成为基于文本的生成型人工智能的技术风险。这与跨多种语言的性能挑战有关。这些人工智能模型通常擅长以类似于其培训数据中的语言生成连贯和准确的内容。然而,当遇到在语法、语法或词汇方面与训练集显著不同的语言时,它们的性能显著降低。这种限制可能导致不准确的翻译,不一致的响应,或者完全无法理解和生成非母语的内容。
当代人工智能模型的监管风险
随着生成性人工智能在各个行业获得牵引力,特别是在受监管的部门,高层管理人员发现自己面临着与负责任地实施和将这种新技术整合到组织中相关的挑战和潜在的监管风险。为了帮助这一进程,德勤值得信赖的人工智能框架提供了一个全面的路线图,以确保在组织中道德和负责任地使用人工智能技术,包括生成型人工智能。
在监管合规方面,欧洲联盟发布的《人工智能法》通过纳入基于风险的战略,制定了创新路线。这使它能够为生成性人工智能系统的运行概述独特但关键的规定,这些系统与德勤所包含的维度适当协调可信的人工智能框架。
高风险人工智能系统的设计和开发应确保其操作足够透明,使用户能够解释系统输出并适当使用。
利用知识图来降低生成式人工智能的风险
知识图(KG)是一种使用图结构连接和表示感兴趣领域知识的方法。它通常建立在组织的现有数据源之上,以网络规模将数据链接在一起,结合结构化和/或非结构化信息。与更常用的关系数据模型相反,图模型被构建为概念或实体及其之间关系的集合。
知识图谱以一种有意义的方式连接复杂的数据和元数据,构成了现代数据分析的基础。
高度相关:知识图谱允许对存储和处理高度连接的数据进行优化
动态:知识图提供了一个灵活和敏捷的模型来适应数据的历史和演变语境:知识图支持将数据的语义和含义嵌入到数据本身中可视化:知识图谱提供了直观的可视化,使我们能够从数据中提取见解数据源、根本原因分析、数据360度视图、合规性和数据质量分析、跟踪变化、影响分析、数据清理和迁移、推荐(链接预测)、元数据管理、语义分析和推理、实体解析、语义搜索和查询回答是公司内部知识图谱的几个用例。知识图可以根据图中编码的显式事实和关系得出新的结论和发现隐含的知识。这通常是通过设计一个所谓的本体来实现的,它建立了一个共享词汇表和一组规则,这些规则规定了数据如何在知识图中相互关联。这种推理和推理能力使知识图成为构建推荐系统和复杂数据分析等任务的强大工具,在这些任务中,理解上下文和关系至关重要。知识图可以提高业务中生成式人工智能的可靠性、有效性和透明度上下文,有助于减轻其许多技术和监管风险,以最大限度地提高其效益。控制/指导:知识图可以通过提供可靠和结构化的信息源来指导生成过程。这可以帮助控制生成人工智能的输出,降低产生可能损害企业声誉或客户关系的误导性或有害内容的风险。数据验证:知识图可以作为验证生成式人工智能模型输出的参考点。如果生成的内容与知识图中的信息相矛盾,则可以对其进行标记以供审查,从而确保业务决策基于准确和一致的信息。透明度和可解释性:知识图可以通过跟踪结构化框架内数据的起源、沿袭和转换,使生成式人工智能模型的工作更加透明和可解释。每个实体、关系和信息片段都用元数据标记,元数据捕获其来源、历史和随时间所做的任何更改。这种可追溯性允许生成人工智能验证数据的真实性、可靠性和上下文,确保图中表示的信息的透明度和可信度。这对于受监管行业的企业或需要向利益相关者证明其决策合理性的企业来说至关重要。上下文的理解:知识图提供了知识领域的结构化和有意义的表示,使生成式人工智能模型能够更好地理解上下文。这可以通过只执行一组确定的和相关的输出来减少产生幻觉的风险,从而提高客户满意度和参与度。偏见减轻:知识图可以帮助识别和减轻生成人工智能模型训练数据中的偏差。通过以结构化的方式表示知识,更容易发现可能表明偏见的模式,帮助企业避免不公平的做法并维护其声誉。要实现这一点,所提供的知识也需要是公正的。独立于语言:知识图谱通过其逻辑和知识的符号表示,超越了语言障碍。而不是依赖于特定的语言或术语(大模型所做的),他们捕获和表示基于普遍理解的符号,关系和结构的知识。这种内在的设计从任何特定的语言中抽象出知识的本质,使其具有普遍的可解释性,并确保无论语言背景如何,核心见解和关系都是可访问的。*对于“缺乏时效性”,当一个新的事实出现时,知识图可以用这个新的信息更新,而不是重新训练整个模型。这并不是图形所独有的,矢量数据库等技术也可以解决这个问题。示例场景:技术助理聊天机器人
场景:Alice是一家大公司的员工,她的工作笔记本电脑正面临间歇性的互联网连接问题。
丰富了知识图谱的生成式人工智能可以定位于组织内的各种功能,为数据驱动的决策、创新和效率提供了强大的工具。人力资源(HR):在组织的人力资源部门,知识图和生成人工智能的集成提供了一种变革性的方法。知识图提供了员工数据、角色、技能和组织需求的结构化和相互关联的视图。当与生成式人工智能结合使用时,这种设置可以简化招聘,个性化员工发展,优化薪酬方案,并增强人才映射。此外,它有助于确保多样性和预测人力资源趋势。业务分析团队:对于业务分析团队,生成式人工智能可以利用对知识图中表示的数据的结构化和语义理解,以(半)自动化地创建KPI(关键绩效指标)报告和基于数据整体视图的可视化。这可以为战略规划、风险评估和决策提供有价值的见解。法律:知识增强的生成式人工智能系统,配备了大量的法律知识,可以帮助起草合同,分析判例法,预测诉讼结果,并以更可靠和透明的方式自动化日常法律任务。如果没有知识图的指导,生成式人工智能可能会产生“幻觉”,要么产生错误的案例,要么误解案例的真实性质(参见这个滥用大模型进行法律研究的例子)。IT部门:在技术支持方面,知识丰富的生成人工智能可用于提供(半)自动化的帮助台,以帮助员工解决常见的技术问题,通过利用互联数据提供更全面的上下文感知支持,增强用户体验并缩短解决时间。首席数据官(CDO)服务:作为CDO服务的一部分,生成式人工智能可以利用知识图来丰富数据质量和完整性,确保组织的数据资产准确、可靠和全面。这可以增强组织的数据治理和管理能力。供应链/物流:当利用生成式人工智能与知识图谱相结合时,整个供应链的互联性和背景被照亮,有助于更准确的需求预测,优化库存和路线规划,增强风险管理。这也支持改善供应商关系,明智的采购决策和全面的产品生命周期管理。生成式人工智能的预测能力和知识图的结构化表示之间的协同作用确保了供应链更有效、更可持续地运行,并符合相关法规,同时增强了客户沟通和服务。客户服务:在客户服务中,生成式人工智能可以利用知识图来生成准确和有效的数据。通过了解客户与产品、服务、问题和客户行为的更广泛的背景,对客户的询问作出相关的回应,从而提高客户满意度和效率。产品开发:在产品开发中,生成式人工智能可以通过提供基于丰富上下文理解的预测性见解来使用知识图来加速产品开发。知识图整合了不同的数据源,确保了市场趋势、客户反馈和历史数据的整体视图,而生成式人工智能利用这些集成的知识来模拟场景、优化策略和预测结果。市场和销售:在市场和销售中,生成式人工智能可以使用知识图为个人客户生成个性化内容或推荐,从而提高客户参与度并推动销售。知识图谱包含产品、活动和客户的数据,使人工智能能够精确定位目标人口统计数据,制作突出关键特征的广告,预测销售,优化广告预算,个性化客户推广,并辨别竞争市场策略。金融:有了知识图提供的丰富背景,生成式人工智能模型可以通过理解金融实体之间细微的依赖关系来产生更好的金融预测。它们还可以快速分析大量的金融数据,识别人类可能忽略的模式和异常。这将带来更准确的预测、风险报告和量身定制的可操作情报,从而优化财务部门的运营。此外,对于监管报告和风险建模,知识增强的生成式人工智能结合了语义和垂直数据谱系,以修复缺失的链接,并提供一致的端到端数据流。在组织战略的动态环境中,在利用现有知识和探索新机会之间取得平衡的方法变得至关重要。下面的矩阵描述了基于使用或不使用知识图(KGs)和生成人工智能(general Al)来导航这种平衡的各种战略姿态。传统战略往往缺乏技术杠杆,可能阻碍创新和适应能力。单独使用kg可以确保系统地利用现有知识,加强数据驱动的决策,尽管可能会扼杀创新的飞跃。相反,单一地使用通用可能会激发创新思维,但可能会陷入无序和潜在的错位探索。将KGs和通用人工智能集成到知识丰富的人工智能中,努力将现有知识的结构化开发与新领域的创造性探索结合起来,在确保基础知识的同时潜在地打开新的视野。对于从业者来说,将KGs的结构化刚性与general的探索性流动性在战术上相结合,可以为强大的战略立场铺平道路,既能保护现有的领域知识,又能开拓新的战略前沿。这种综合方法虽然看起来是最佳的,但需要彻底的技术整合和熟练的战略协调,才能真正利用kg和general在有效管理勘探开发紧张关系方面的协同潜力。就像树根之于树一样,知识图谱将生成人工智能锚定在理解的深度上……
在企业中实现知识丰富的生成式人工智能涉及几个关键步骤:
具体的步骤可以根据具体的用例、所使用的生成人工智能的类型以及知识图的结构和内容而变化。在整个实施过程中考虑数据隐私和安全、人工智能道德和法规遵从性等因素也很重要。从头开始构建知识图谱是一项耗时且费力的任务。然而,在企业环境中,生成式人工智能可以在简化和加速这些知识图的开发方面发挥关键作用。当涉及到填充知识图时,生成式人工智能可以用于从文本中提取实体和关系的实例,给定图的本体或模式。对于图补全的数据充实,生成式人工智能可以通过基于图的现有结构和内容生成新的节点和关系来填补知识图中的空白。这有助于丰富知识图谱,使其更加全面。在实践中,这项任务可能涉及审查添加的内容,以确保其准确性。对于预测分析,生成式人工智能可以基于历史数据预测知识图的未来状态。这对于业务环境中的战略规划和决策特别有用。
将知识图与大模型合并的各种架构设计。虽然这些是灵感的来源,但根据您组织的独特需求和规格进行定制是必不可少的。基于检索增强生成(retrieval - augmented Generation, RAG),结合了LLM中基于知识图的检索方法和基于生成方法的优势。RAG不是完全从零开始生成响应,而是首先从图中检索相关信息,然后使用这些检索到的信息作为上下文来指导生成详细和准确的响应。为了将用户的自然语言查询转换为图形查询,必须使用一组具有代表性的示例查询进行提示工程。
通过将知识图的准确性与生成模型的流畅性相结合,RAG提供了更知情和上下文感知的输出,也解决了LLM缺乏时效性的问题。虽然这种方法消除了对LLM进行微调的需要,但丰富的输出仅限于知识图所处理的特定领域。
基于LLM的监督微调,并从知识图中获得额外的结构化知识。这就需要对知识图进行语言化,这意味着将图中的结构化信息转换成一些自然语言描述或叙述,可以被LLM理解。例如,下面的图有四个实体和四个关系,可以用语言表达为:
这种方法允许包含更广泛的主题,但是,它伴随着信息更新时LLM的昂贵微调。
选项3是选项1的扩展版本,其中添加了一个额外的矢量数据库,以覆盖无法通过运行图查询直接从知识图中检索到的更多主题。虽然知识图显式地描述了实体之间的关系和语义上下文,但添加的向量数据库提供了更快的相似性搜索功能,允许在数据点之间进行更细微的比较,并提供更隐式和相关的结果。
这里的另一个扩展点是语义推理的能力,以扩大所生成输出的深度和上下文准确性。这需要设计一个表示特定领域知识的本体,概述实体、它们的属性以及它们之间的关系,从而可以在知识图中明确的数据之外得出有意义的结论。
这种方法提供了增强的覆盖范围、更深入的语义推理以及对不断更新的综合知识的访问,同时消除了LLM微调的需要。然而,随着数据的发展,它带来了维护和同步其他数据库的挑战。此外,还需要考虑增加的处理时间、本体的初始开发和维护,以及实现推理引擎的相关费用。
结论
当我们在人工智能的动态领域中导航时,知识图与生成式人工智能的集成作为一种变革性的方法脱颖而出,以实现值得信赖和负责任的企业决策。知识图的特点是知识的结构化表示,其中实体(通常表示概念或对象)及其之间的关系是明确定义的。它们提供了一个可靠和可操作的知识地图,不仅可以捕获明确的事实,还可以实现语义理解,允许推断隐含的知识。
另一方面,生成式人工智能的特点是能够产生新的内容,无论是文本,图像、音乐或其他形式的数据,反映或模拟其训练数据中看到的模式。将这两个强大的领域合并到一个知识丰富的人工智能生态系统中,不仅可以促进精确的产出,还可以产出充满丰富内容的上下文。
知识图可以一致而准确地影响和指导生成式人工智能模型(如llm)的行为,而无需专门的训练。随着大模型的不断发展,知识图谱提供了一种确保顶级模型质量一致的方法。因此。投资开发高质量的企业知识图谱是有益的,无论所使用的大模型是什么。
本白皮书只是我们进入知识丰富的人工智能之旅的开始。虽然我们已经触及了它的重要性,并提出了一些实现它的想法,但在接下来的几年里,这个领域还有更多的事情要展开。
随着技术的进步,人工智能与深度知识的融合将带来更多的创新和突破。我们正处于一段激动人心的旅程的开始,还有很多值得期待的……
还没有评论,来说两句吧...