前言
尽管这是对生产级生成式人工智能现状的巨大改进,但整个领域仍然存在一个问题:RAG是否正在经历它的最后时刻,这些创新是否只是在做无用功?
01
顾名思义,这个想法是从一个已知的数据库中检索数据,LLM很可能从未见过这些数据,并实时将其输入到模型中,这样它就更新了上下文,更重要的是,更新了语义相关的上下文,以提供准确的答案。
但是这个检索过程是如何工作的呢?
整个体系结构源于一个单一的原则:检索与请求或提示上下文相关的语义上有意义的数据的能力。
这一过程涉及到三个要素的使用:
1. 嵌入模型
2. 检索器,通常是矢量数据库
3. 还有生成器——LLM
首先也是最重要的一点是,为了使这个检索过程发挥作用,你需要数据处于“嵌入形式”,即数字向量形式的文本表示。
更重要的是,这些嵌入有一个相似性原则:相似的概念会有相似的向量。
获得嵌入后,我们将它们插入向量数据库(检索器),这是一个存储这些嵌入的高维数据库。
然后,每当用户发送如下请求“给我一只黄色的猫类似的结果”时,矢量数据库就会执行“语义查询”。
通俗地说,它提取与用户查询最接近的向量(距离)。
由于这些向量代表基本概念,因此相似的向量将代表相似的概念,在本例中表示其他猫。
一旦我们提取了内容,我们就构建LLM提示(prompt),封装:
1. 用户的请求 2. 提取的内容 3. 以及通常的一组系统指令
简而言之,这就是RAG,一个为用户查询实时(在推理时)提供相关内容以增强 LLM 响应的系统。
但这个过程听起来好得令人难以置信,当然,事情并不像看起来那么神奇。
02
将当前的RAG系统可视化的一种方式就像下图中的裤子:
虽然这种裤子可能适合一些受众,但大多数人不会穿,因为它们没有同质性,尽管缝合的裤子原本是为了不被注意到而设计的。
这个比喻背后的原因是标准的RAG系统组装了三个不同的组件,这些组件分别进行了预训练,而且从定义上来说,它们本来就不应该在一起。
相反,RAG 2.0系统(https://contextual.ai/introducing-rag2/)从一开始就被定义为“一体”。
实际上,整个系统在连接时进行端到端的训练,就像假设LLM应该始终与它们绑定的向量数据库一起保持更新一样。
与标准的RAG相比,预训练、微调和从人类反馈中进行强化学习(RLHF)等标准LLM训练的所有重要组件都是从零开始进行的,包括LLM和检索器(向量数据库)。
不可否认的结果表明:
尽管使用了几乎可以保证比GPT-4更糟糕的独立模型,但这种新方法的性能优于GPT-4和其他检索系统之间的所有其他可能的RAG 1.0组合。
原因很简单:在RAG1.0中,我们单独训练事物,然后将它们缝合在一起,并希望得到最好的结果。但在RAG 2.0中,情况大不相同,因为所有组件从一开始就在一起。
尽管RAG2.0的优势显而易见,但仍存在一个大问题。
03
尽管看起来RAG 2.0可能很快就会成为企业标准,因为它的设计专门针对那些不愿与LLM提供商共享机密数据的公司,但有理由相信,无论是哪个版本的RAG,最终都不会完全被需要。
巨大序列长度的到来
因此,在我看来,RAG最终能否生存并不取决于准确性,而是取决于技术之外的另一个关键因素:成本
更好的商业案例,或者死亡
简而言之,运行非常长的序列成本非常高昂,以至于对于具有极长序列长度的模态,例如DNA,甚至不考虑使用Transformer。
事实上,在DNA模型中,例如EVO,研究人员使用了Hyena运算符而不是注意力,以避免之前提到的二次关系。Hyena运算符使用长卷积而不是注意力来捕获长距离依赖关系,成本是次二次的。
其他替代方案旨在采用混合方法,而不是完全放弃注意力,在注意力和其他操作者之间找到最佳平衡点,以较低的成本保持性能。
最近的例子包括Jamba,它巧妙地将Transformer与其他更高效的架构(如Mamba)混合在一起。
总的来说,我们很快就会看到处理极长序列的成本会大大降低,甚至只是当前价格的一小部分,这应该会增加对RAG架构的需求的怀疑。
当那个时候来临时,我们几乎可以保证会发生,我们还会依赖RAG吗?我不知道,但在这一点上我们可能在做无用功。
碳泽信息从去年开始一直在针对LLM在安全运营(自动化和工作流编排)方面进行研究和实践,取得的一些进展和经验,同时也发现了一些问题。我们发现许多应用场景感觉不太对,是在用更大的成本、更慢的效率去取代一些已经很成熟的方案,这或许要等到LLM进一步发展才能得到实质性的改善。我们也在研究和使用RAG,正如本文所言,我们会依赖RAG吗?科技的快速进步会改变很多,会带来惊喜,也会带来意想不到的的问题,利用科技利用AI,而不是被科技和AI挟持。
如想知道更多前沿技能知识,请持续关注碳泽信息!
End
新一代智能安全运营平台
电话:400-1788-258
销售咨询:[email protected]
技术支持:[email protected]
官网:http://www.tanze.net.cn
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...