日前,一支来自中国的团队正式对外发布通用型AI Agent产品Manus。据团队介绍,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越OpenAI的同层次大模型。
从介绍来看,相较于目前的大模型产品,作为通用型Agent,Manus定位于一位性能强大的通用型助手,对于用户不仅仅是提供想法,而是能将想法付诸实践,真正解决问题。
从发布的视频演示来看,Manus在接到用户指令后可以直接操作电脑完成一系列报告撰写、表格制作等工作,并在最后导出符合用户需求的产品。
并且,不同于此前各类功能相对简单的人工智能助手,Manus拥有超强学习能力和适应性的“数字大脑”,不再局限于单一任务,而是能够理解复杂指令、自主学习、跨领域协同,真正像人一样思考和行动。
据悉,该团队成员来自中国,团队计划后续开源部分技术,推动AI社区共同发展。
据其团队介绍,Manus是一个真正自主的AI代理,能够解决各类复杂多变的任务。与传统AI助手不同,Manus不仅能提供建议或答案,还能直接交付完整的任务成果。
Manus来自拉丁语Mens et Manus,就是手脑并用(mind and hand)的意思。
Manus采用多重签名(multisig)系统,由多个独立模型驱动。今年晚些时候,官方将计划开源其中的一些模型,特别是 Manus的推理(postering)部分。
与Manus同步出圈的还有一段长达四分钟的演示demo。在这些案例中,Manus完全自主地完成从规划到执行的全流程,展示了真正的Agent能力,而非简单的助手功能。
比如第一个任务从15份简历中筛选出适合强化学习算法工程师职位的人选,Manus已经展现出了像人类实习生的一面,手动解压缩文件,并逐页浏览每一份简历,同时记录其中的重要信息。官方表示,所展示的内容还仅仅是Manus能力的冰山一角。
当AI Agent通过调用一长串思维链和工具调用,最终输出一个完整、专业的结果时,用户们开始感叹AI真的能帮人类做事了。
为了确保结果的可重复性,Manus使用与其正式版本完全一致的配置进行评测。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...