规模竞赛热潮退去,
专业模型向小成为发展趋势
曾一度席卷全球的AI大模型“参数规模竞赛”热潮逐渐退去,业界对“模型越大越好”的单一追求正被更务实的思考所取代,且其“通用性”难以满足专业领域的精细化需求,甚至可能造成资源浪费。
根据Epoch AI数据,2024年发布的AI模型中,千亿规模以下的模型占比超75%,成为主流。在此背景下,更轻量、更高效的“小模型”迎来了前所未有的发展机遇和施展空间。
端侧小模型:
资源受限场景下的高效之选
高质量小模型能够将强大的AI能力“浓缩”进资源有限的终端设备,实现本地化、实时化、低成本的智能决策。主要有四大优势:
一是对训练集要求低。小模型参数量通常介于几百万至几亿之间,模型结构更简洁,无论是数据收集还是模型训练,难度都远低于大模型,这让其在数据获取有限的端侧场景中更易落地。二是所需资源更低且利用率高。一方面,其对计算资源和存储空间的需求更小,能有效规避内存溢出问题,轻松适配移动设备、物联网终端等资源受限的设备;另一方面,通过剪枝、量化、知识蒸馏等优化技术,小模型可进一步降低计算需求,且模型开发与应用更具针对性,能显著减少数据资源浪费。三是能耗需求更低。得益于较低的计算复杂度,小模型对算力和高性能硬件的需求大幅降低,叠加其轻量级特性,多方因素共同作用下,能耗水平显著下降,更符合端侧设备长效运行的需求。四是应用场景专业性更强。小模型可针对特定专业领域或具体业务需求进行聚焦训练,提供定制化服务,尤其是在处理具体场景的语音识别、图像处理和问答等实时性要求高的任务时更具优势。
截至2025年中期,以下模型均在产业上呈现出了强大的性能表现,甚至可以超越体量大得多的前沿大模型:
Phi-3 Mini (Microsoft):设计紧凑,性能卓越,专为极致的推理速度而生。
Gemini Nano 1.5 (Google):深度集成于 Android 15 系统,为众多设备端功能提供核心驱动。
LLaMA 3 8B (Meta):凭借其开放权重,在学术研究和移动应用领域被广泛采用。
Mistral 7B与8x7B (Mistral.ai):凭借其模块化设计,在普通消费级硬件上也能展现出色性能。
未来复杂智能体的应用落地
完全要依靠小模型吗?
1.优势获实证,小模型适配端侧智能体需求
近期产业界与学术界的研究成果,有力印证了端侧高质量小模型在智能体应用中的核心价值。英伟达研究院和佐治亚理工大学的研究人员最近发表了一篇热点论文,提出“小模型才是智能体的未来”,文章中同样提到了上文中表述的小模型的核心优势,强调了其低时延、高能效、强隐私保护与本地化部署能力等特性,天生更适合智能体系统的架构。
尤为引人注目的是,英伟达还对三款真实世界的AI智能体进行了测试,有力印证了高质量小模型(SLM)在智能体应用中的巨大潜力,可见小模型确实能较好地适配智能体的系统任务。
MetaGPT:60%的任务可以用SLM取代
Open Operator:40%的任务可以用SLM取代
Cradle(图形界面自动化):70%的任务可以用SLM取代
这些数据强有力地表明,在边界清晰、规则相对明确的任务场景中,高质量SLM已能胜任相关的工作,成为智能体实现快速响应与本地执行的理想技术选择。
2.正视当前局限,单一模型难以应对复杂智能体高阶需求
尽管端侧高质量小模型在特定领域展现出显著的可替代性,但我们也必须清醒认识到,当前取得高替代率的智能体任务,其复杂度相对有限且边界清晰,然而未来智能体的终极目标是实现深度的场景理解、跨任务的自主规划与闭环执行、以及对开放环境下复杂问题的处理能力。这包括但不限于:
多模态融合推理:综合理解文本、图像、语音、传感器数据等。
长期目标分解与规划:将复杂目标拆解为可执行的子任务序列。
动态环境适应:在非结构化、快速变化的环境中做出鲁棒决策。
面对这些高阶需求,当前形态的小模型在认知深度、跨领域泛化能力、知识广度方面仍面临显著挑战,难以独立支撑未来复杂智能体的全部功能,过度依赖小模型的端侧部署可能成为智能体能力跃升的瓶颈。
3.未来方向:构建“小模型筑基、大模型协同”的生态体系
面向未来智能体的复杂需求,“一刀切”地选择单一模型并非正解。产业发展的核心方向在于拥抱分层化、协同化的智能架构,充分发挥不同规模模型的优势,让小模型聚焦实时响应与本地决策,大模型提供深层认知与复杂规划支持,才能真正支撑起未来智能体在复杂多变环境中的可靠、高效运行,最终实现智能技术在物联网等广阔场景的普惠化、规模化应用。
端侧筑基:
打造高质量小模型核心能力
大力发展高质量、高精度、高能效、强安全性的小模型,专注于处理本地高频、低时延、数据敏感性高的任务执行,成为智能体感知环境、快速响应的基础决策单元。
边云协同:
引入大模型的深度认知与规划
充分利用云端或边缘侧大模型强大的知识库、深度语义理解、复杂推理和长期规划能力,处理需要深度理解、跨域知识融合、复杂策略生成和宏观目标管理的任务,并为端侧小模型提供任务指导、策略优化和知识更新支持。
高效协同机制:
实现智能体有机统一
关键在于设计高效的模型间通信协议、智能任务调度框架与知识共享机制,确保端侧小模型与边云端大模型能够优势互补、无缝协作、动态适配,共同构成一个有机统一的智能体任务系统,实现整体效能最大化。
作为国家高端专业智库,中国信通院将持续深耕物联网与人工智能融合领域,联合产学研用各方,加速推动大小模型协同的创新突破、标准制定与产业落地,为我国抢占万物智联时代的发展先机提供坚实支撑。
吴康桥,中国信通院工业互联网与物联网研究所工程师,主要从事标识解析、智能物联网等领域的研究工作,联系方式:13020600455,[email protected];
谢滨,中国信通院工业互联网与物联网研究所高级工程师,主要从事标识解析、智能物联网、数据基础设施等领域的技术研究、标准研制与产业促进等工作,联系方式:13120121874,[email protected]。
业务合作咨询
如果您对中国信通院物联网相关业务感兴趣,欢迎扫描下方二维码填写业务咨询表单。我们将尽快安排专人与您取得联系,期待与各界的深入交流与业务合作。
业务合作咨询
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...