安第斯大模型登顶SuperCLUE-Safety安全总榜

近日，在全新推出的中文大模型多轮对抗性安全基准测评——SuperCLUE-Safety中，OPPO安第斯大模型（AndesGPT）荣膺榜首。这一具有里程碑意义的成绩标志着AndesGPT在安全性和可靠性方面达到了业界领先水平。

图1 SuperCLUE-Safety安全总榜

SuperCLUE-Safety测评体系是针对中文大模型安全性与负责任性的全面检验平台，旨在通过引入模型和人类的迭代式对抗性技术、多轮交互场景测试以及覆盖传统安全类、负责任人工智能和指令攻击三大领域的20多个子维度评价，来评估大模型在真实场景下的安全防护性能。

在此次测评中，AndesGPT展现出卓越的安全防护实力。取得了负责任人工智能榜和指令攻击榜国内第一、传统安全类榜国内第二的好成绩。

它不仅能有效应对各类不良诱导和恶意输入，在涉及财产隐私保护、违法犯罪预防、身体伤害规避等传统安全领域表现突出；同时，在更高阶的责任敏感问题上，如遵纪守法、社会和谐维护及心理学考量等方面均体现了与人类价值观的高度对齐。

尤其值得注意的是，AndesGPT在防范指令攻击方面表现出色，能够成功识别并抵御误导性提示和潜在恶意指令，确保在复杂交互情境下输出内容的安全可靠。

AndesGPT的成功得益于OPPO在人工智能领域的持续投入和研发创新。早在2020年，OPPO就已启动相关技术的探索与实践，曾获得大规模知识图谱问答KgCLUE行业评测的第一名。去年九月，AndesGPT更是登上SuperCLUE排行榜，在十大基础能力排行榜的“知识与百科”能力中仅次于GPT4排名国内大模型第一，“角色扮演能力”中排名前三。同年十二月，AndesGPT登上SuperCLUE国内模型排行榜第三。

图2 KgCLUE1.0，知识图谱问答榜

图3 SuperCLUE总排行榜

未来，OPPO将继续加强大模型的安全性和可靠性研究，推动人工智能技术的良性发展和广泛应用，为用户带来更加安全、智能、便捷的体验。

END

About AndesBrain

安第斯智能云

安第斯智能云（AndesBrain）是服务个人、家庭与开发者的泛终端智能云，致力于“让终端更智能”。安第斯智能云提供端云协同的数据存储与智能计算服务，是万物互融的“数智大脑”。

安第斯大模型（AndesGPT）是OPPO自主训练的、个性专属大模型与智能体。作为驱动OPPO公司AI战略的核心引擎，安第斯大模型全面赋能OPPO智慧终端，持续构建知识、记忆、工具、创作能力，并通过与终端结合的AI智能体和多模态对话范式，给用户带来全新的个性专属智能体验。