无相如何突破万步复杂操作、亿级Token窗口限制？

一切先进的技术皆与魔法无异。但把魔法拆解成零件，也就没那么神秘了。

粗糙理解：智能体的魔法就是把一团乱麻的难题拆成一次次的“大模型独立思考”。

例如，你的要求是：制定一个3天的沈阳旅行计划。

拆解后的操作如下：

1. 大模型会思考一个总体规划，也就是把这个任务分为8个具体步骤。如下图所示：

2. 大模型按顺序思考步骤1~步骤8。思考到步骤8的时候，得出的结果，就是整个任务的最终结果。

注意，之所以说“独立思考”，是因为大模型的每一步思考真的是*独立*的。

为了后文更易理解，这里插播一组（很多人都不知道的）大模型基本原理：

1. 大模型的本质仅仅是一台“输入-输出”的机器。

你给它输入一段文字，它就会吐出一段文字。

这段文字可以是人类语言、代码、指令。

2. 大模型是没有记忆的。

它不会记得你“上次”给它输入了什么，只会根据这次的输入来决定输出。

如果你想让它在上次的基础上进一步思考，就必须把上次的输出结果先回填到这一次的输入窗口中，再续上这次的输入。

通过这样的方式，让大模型*假装*有记忆力。

3. 大模型思考耗费的计算力和上下文长度的平方成正比。

也就是说，受制于计算力，窗口的大小必须严格控制在一个数值。

比如，64k Token，可以粗糙理解为：输入+输出不能超过64000个词。

这里，一个根本的限制出现了：

你不能无限地把之前N步的结果回填到大模型的输入窗口中。

思考的步骤越多，意味着在后面的步骤你要一次性填入的旧信息就越多。肯定会有一刻，出现“输入超出64k Token”的情况。由此，你必须截断更早的信息。

可信息不全，模型就会“胡说八道”，智能体就会“胡作非为”，偏离预定航道。

这也意味着，在目前的技术条件下，智能体只能完成“有限复杂的任务”。

那么这个“限”是多少呢？

以Manus为例，它能良好完成的任务，总思考不能超过20步，对应总Token处理量在20万~70万。

但是要完成一次标准的网络入侵调查，至少需要思考2000步，多的能到8000 步，等效于 2000万 ~ 1亿Token。相当于 Manus 处理极限的 100 倍还多。

况且，在这2000步中的很多步，都需要阅读大量数据。

例如：为了摸排一个线索，同时翻看1000条安全日志再正常不过了。

可日志是设计给人看的，每一条都很详尽，64k的AI窗口只能塞下一两百条日志。。。

只1步就打爆了模型的上下文窗口，这种情况下还要走2000步，怎么可能？

AI 没有记忆，这是个既定事实。只有把最核心的信息提炼出来，一句废话都不留，才有希望在一个64k窗口里塞进之前成百上千步的核心信息。

看到这，我脑海里突然闪现出一部电影。

那是25年前导演诺兰的成名作《记忆碎片》。

主角兰纳德的妻子被杀，他在和凶手搏斗的过程中脑部受伤，患上了“短期记忆丧失症”。

每隔10分钟，他的记忆就会清空一次。但他却要凭着这样的脑袋去侦查案件，为亡妻复仇。

兰纳德选择的方法，就是他在墙上贴了一张巨大的关系图。每次在记忆清空前，他就把获得的关键信息用拍立得拍下来，贴在关系图上。

这样，当他大脑被迫重启时，就会立刻看到眼前这张图，明白了自己之前的进度。

每个“记忆周期”，他都先用最短的时间温习前面的信息，并用剩余的时间在此基础上继续调查，最后把新信息填在图上。

如此循环。

这还不够癫，兰纳德自制了纹身笔，把最核心的信息纹在身上。

这样，无论他走到哪，在什么环境下失忆，都能迅速补齐前面N步的信息。哪怕光着屁股醒来，都没问题（甚至更好）。

墙上的关系图和身上的纹身有个共同点：信息极其*精炼*。这，不就是*把大量信息压缩进一个有限窗口*的绝佳方案吗？

为了让没有记忆的AI侦探在赛博时空里进退，必须先给他配一个“数据精炼厂”。

未完待续....

往期内容回顾：

推荐站内搜索：最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……

宙飒天下

正文

无相如何突破万步复杂操作、亿级Token窗口限制？

相关阅读

活动回顾｜2025年美团北斗计划 · 基座大模型技术交流会圆满落幕

使用大模型分析判断一条web请求是否具有攻击威胁

CNCC2025｜信息无障碍的中国方案论坛举办

中美智能体发展战略与竞争格局全景报告

发表评论取消回复

还没有评论，来说两句吧...

目录[+]