中国团队发布通用型AI Agent产品Manus性能超越OpenAI炸裂科技圈

日前，一支来自中国的团队正式对外发布通用型AI Agent产品Manus。据团队介绍，Manus在GAIA基准测试中取得了SOTA（State-of-the-Art）的成绩，显示其性能超越OpenAI的同层次大模型。

从介绍来看，相较于目前的大模型产品，作为通用型Agent，Manus定位于一位性能强大的通用型助手，对于用户不仅仅是提供想法，而是能将想法付诸实践，真正解决问题。

从发布的视频演示来看，Manus在接到用户指令后可以直接操作电脑完成一系列报告撰写、表格制作等工作，并在最后导出符合用户需求的产品。

并且，不同于此前各类功能相对简单的人工智能助手，Manus拥有超强学习能力和适应性的“数字大脑”，不再局限于单一任务，而是能够理解复杂指令、自主学习、跨领域协同，真正像人一样思考和行动。

据悉，该团队成员来自中国，团队计划后续开源部分技术，推动AI社区共同发展。

据其团队介绍，Manus是一个真正自主的AI代理，能够解决各类复杂多变的任务。与传统AI助手不同，Manus不仅能提供建议或答案，还能直接交付完整的任务成果。

Manus来自拉丁语Mens et Manus，就是手脑并用（mind and hand）的意思。

Manus采用多重签名（multisig）系统，由多个独立模型驱动。今年晚些时候，官方将计划开源其中的一些模型，特别是 Manus的推理（postering）部分。

与Manus同步出圈的还有一段长达四分钟的演示demo。在这些案例中，Manus完全自主地完成从规划到执行的全流程，展示了真正的Agent能力，而非简单的助手功能。

比如第一个任务从15份简历中筛选出适合强化学习算法工程师职位的人选，Manus已经展现出了像人类实习生的一面，手动解压缩文件，并逐页浏览每一份简历，同时记录其中的重要信息。官方表示，所展示的内容还仅仅是Manus能力的冰山一角。

当AI Agent通过调用一长串思维链和工具调用，最终输出一个完整、专业的结果时，用户们开始感叹AI真的能帮人类做事了。

为了确保结果的可重复性，Manus使用与其正式版本完全一致的配置进行评测。

Manus奉行的技术理念“less structure more intelligence”（更少的结构、更多的智能），与主流也有些不同。他们认为，当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实时，computer use、deep research、coding agent 等能力会自然涌现，无需被设计为特定的产品功能。