一切先进的技术皆与魔法无异。但把魔法拆解成零件,也就没那么神秘了。
粗糙理解:智能体的魔法就是把一团乱麻的难题拆成一次次的“大模型独立思考”。
例如,你的要求是:制定一个3天的沈阳旅行计划。
拆解后的操作如下:
1. 大模型会思考一个总体规划,也就是把这个任务分为8个具体步骤。如下图所示:
2. 大模型按顺序思考步骤1~步骤8。思考到步骤8的时候,得出的结果,就是整个任务的最终结果。
注意,之所以说“独立思考”,是因为大模型的每一步思考真的是*独立*的。
为了后文更易理解,这里插播一组(很多人都不知道的)大模型基本原理:
1. 大模型的本质仅仅是一台“输入-输出”的机器。
你给它输入一段文字,它就会吐出一段文字。
这段文字可以是人类语言、代码、指令。
2. 大模型是没有记忆的。
它不会记得你“上次”给它输入了什么,只会根据这次的输入来决定输出。
如果你想让它在上次的基础上进一步思考,就必须把上次的输出结果先回填到这一次的输入窗口中,再续上这次的输入。
通过这样的方式,让大模型*假装*有记忆力。
3. 大模型思考耗费的计算力和上下文长度的平方成正比。
也就是说,受制于计算力,窗口的大小必须严格控制在一个数值。
比如,64k Token,可以粗糙理解为:输入+输出不能超过64000个词。
这里,一个根本的限制出现了:
你不能无限地把之前N步的结果回填到大模型的输入窗口中。
思考的步骤越多,意味着在后面的步骤你要一次性填入的旧信息就越多。肯定会有一刻,出现“输入超出64k Token”的情况。由此,你必须截断更早的信息。
可信息不全,模型就会“胡说八道”,智能体就会“胡作非为”,偏离预定航道。
这也意味着,在目前的技术条件下,智能体只能完成“有限复杂的任务”。
那么这个“限”是多少呢?
以Manus为例,它能良好完成的任务,总思考不能超过20步,对应总Token处理量在20万~70万。
但是要完成一次标准的网络入侵调查,至少需要思考2000步,多的能到8000 步,等效于 2000万 ~ 1亿Token。相当于 Manus 处理极限的 100 倍还多。
况且,在这2000步中的很多步,都需要阅读大量数据。
例如:为了摸排一个线索,同时翻看1000条安全日志再正常不过了。
可日志是设计给人看的,每一条都很详尽,64k的AI窗口只能塞下一两百条日志。。。
只1步就打爆了模型的上下文窗口,这种情况下还要走2000步,怎么可能?
AI 没有记忆,这是个既定事实。只有把最核心的信息提炼出来,一句废话都不留,才有希望在一个64k窗口里塞进之前成百上千步的核心信息。
看到这,我脑海里突然闪现出一部电影。
那是25年前导演诺兰的成名作《记忆碎片》。
主角兰纳德的妻子被杀,他在和凶手搏斗的过程中脑部受伤,患上了“短期记忆丧失症”。
每隔10分钟,他的记忆就会清空一次。但他却要凭着这样的脑袋去侦查案件,为亡妻复仇。
兰纳德选择的方法,就是他在墙上贴了一张巨大的关系图。每次在记忆清空前,他就把获得的关键信息用拍立得拍下来,贴在关系图上。
这样,当他大脑被迫重启时,就会立刻看到眼前这张图,明白了自己之前的进度。
每个“记忆周期”,他都先用最短的时间温习前面的信息,并用剩余的时间在此基础上继续调查,最后把新信息填在图上。
如此循环。
这还不够癫,兰纳德自制了纹身笔,把最核心的信息纹在身上。
这样,无论他走到哪,在什么环境下失忆,都能迅速补齐前面N步的信息。哪怕光着屁股醒来,都没问题(甚至更好)。
墙上的关系图和身上的纹身有个共同点:信息极其*精炼*。这,不就是*把大量信息压缩进一个有限窗口*的绝佳方案吗?
为了让没有记忆的AI侦探在赛博时空里进退,必须先给他配一个“数据精炼厂”。
未完待续....
往期内容回顾:
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...