01
前言
在AI技术浪潮席卷全球、重塑各行各业的今天,ByteSRC深知每一个AI创新应用的背后,都离不开坚实的安全基石。怀着对每一位安全研究者的由衷敬意,我们正式发布《ByteSRC AI业务收录全景图及漏洞定级标准》。详细界定了AI相关漏洞/情报的定义与评估标准,更明确了我们为您的卓越贡献所备的丰厚奖励。
我们期待与您携手并进为数亿用户保驾护航,以技术之力铸就更安全、更可信的 AI 时代。
一文读懂“挖什么、怎么评、奖多少”
👇
02
ByteSRC AI 业务收录全景图
03
漏洞定义与评级总览
* 各等级详细定义可点击文末“阅读原文”查看
【AI漏洞验证标准】
审核团队在验证AI漏洞时,将重点关注以下方面:
1.可复现性
核心要求: 漏洞必须能够稳定复现。
特殊考量: 我们理解部分AI漏洞可能存在概率性复现的问题。在这种情况下,请提供详细的统计证据和多次尝试的结果,以证明其并非偶然现象。
2.有效性
核心要求: 漏洞必须能够导致明确的安全风险,而不仅仅是模型“幻觉”。
判定标准: 我们会评估漏洞是否能被用于绕过核心安全机制、窃取敏感数据、执行恶意代码或对业务造成实质性破坏。
3.影响范围
核心要求: 漏洞的影响需要被清晰界定。
评估维度: 我们会评估受影响的用户规模、数据敏感性、业务重要性以及潜在的经济或声誉损失,并以此作为漏洞评级的重要依据。
4.创新性:对于利用思路新颖的漏洞,或发现通用性强、对行业具有警示意义的新型AI攻击手法的报告,我们将颁发额外奖励和荣誉。
04
情报定义与评级总览
情报类型及范围
1.服务滥用:基于平台模型服务进行不法利用,对社会公共秩序造成恶劣影响、侵犯用户权益、违背法律法规的滥用行为情报且提供清晰的人员、平台、手法、截图等关键线索
2.信息泄漏:外部买卖或发布与平台闭源模型源码、平台模型SytemPrompt、模型调优方案机密等相关敏感信息的情报,或涉及平台用户隐私的相关情报且提供清晰的人员、发布平台、数据样本等关键线索
3.污染/投毒:通过提示词、数据集等方式进行模型污染,影响模型在所有用户场景的数据输出的情报/线索
4.薅羊毛:通过批量注册账号/服务、绕过安全限制等方式可大量免费消耗平台算力的情报/线索
各等级情报定义
# 降级场景:
1.情报完整性较低的情报 。情报应包含所提交情报场景所对应的关键线索(威胁来源、攻击路径、攻击方法、风险类型、发生时间、损失预估),缺少部分关键线索可导致降级。
2.有刷单/刷量等风控策略绕过行为,但算法会陆续覆盖或有其他风控策略兜底的情况。
05
暂不收取范围
1.非信息安全漏洞导致的内容安全风险不收、与模型提示和响应内容相关的问题暂不收取。如这些问题对产品可造成额外的、可直接验证的安全影响(机密性、完整性、可用性),则正常收取。
模型提示和响应内容的相关问题举例:
-模型提示:越狱/安全绕过(如 DAN 等相关提示词)
-模型响应内容:大模型输出恶意内容(如违规营销信息、恶意代码等)
-模型幻觉:让大模型假装成计算机终端并执行命令等
❌禁止使用任何违反平台规定或法律法规的文字、图片、视频作为测试素材,同时禁止上传至ByteSRC平台。
2.非隐私数据泄露相关的AI服务风险暂不收取(jail break,prompt leak等)
3.个人用户从Coze发布至豆包的智能体及插件所引发的安全漏洞不收取(如UGC 内容中用户自身行为导致的信息泄露不收取)。
4.沙箱环境中的代码执行/命令执行本身是预期的产品功能,如果能逃逸或影响到其他用户容器,则正常评分。(有效条件:逃逸到宿主机/物理机,获取有效敏感信息和权限,或证明通字节内网)
06
测试规则
1.禁止使用可能造成业务影响的测试工具和手法。如:只允许手工低频测试,不允许手工高频发包、或使用自动化工具/插件测试,避免因过度测试导致业务告警、服务中断等问题。
2.禁止进行内网渗透测试行为和任何有害化的测试行为,包括但不限于:获取内网权限后在内网使用扫描器、或横向接触非对外开放系统目标、获取内网应用/主机权限/数据、上传 webshell、反弹 shell等。
3.禁止下载、保存、传播业务数据,包括但不限于业务服务器以及Github 等平台泄露的源代码、运营数据、用户资料、登录凭证等,若存在不知情的下载行为,需及时说明和删除;测试过程中获取的相关代码/数据,务必在SRC漏洞确认后立即删除,不得非法留存及使用(无论数据是否脱敏)。
4.禁止任何类型的网络拒绝服务(DoS 或DDoS)测试,或通过软件、工具自动扫描产生大量数据流量的行为。
5.禁止进行近源攻击或者黑客物理入侵、社会工程学测试或邮件钓鱼等非技术漏洞测试,尤其是禁止使用社工库等非法手段获取用户密码。
6.禁止使用任何违反平台规定或法律法规的文字、图片、视频作为测试素材,同时禁止上传至ByteSRC平台。
7.禁止以证明漏洞危害为借口,对目标系统进行破坏性操作,如删改数据/配置、植入恶意程序等。
8.禁止用户打扰类测试。包括但不限于向真实用户邮箱、手机、社媒账号等渠道发送测试信息、发起群聊、推送push等干扰信息;或通过电话、即时通讯工具等方式直接联系真实用户进行测试。
9.禁止对未授权厂商/业务、超出测试范围列表进行漏洞挖掘,可与管理员联系确认是否属于资产范围后进行挖掘,否则未授权的法律风险将由漏洞挖掘者自己承担。
10.请将所有测试操作和行为及时、如实、完整上报,因故意瞒报、漏报等造成业务损害或潜在风险,ByteSRC保留追责权利。
END
互动有礼
欢迎转发
分享本文至朋友圈or安全社群中
即可扫码参与抽奖
选2位小伙伴送出字节定制中秋礼盒
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...