利用 AI 生成的虚假信息，正在蚕食你我的善意 | 易盾安全专家说 - 新鲜讯息

2025年1月7日9时5分，西藏自治区定日县发生6.8级地震，灾情牵动了全国人民的心，许多网友在社交平台上为灾民祈福。但与此同时，一些疑似虚假的信息正在传播，造成广泛误导。

比如下面这张图片：一个戴帽子的小孩被重压在倒塌的建筑物下，在某短视频平台上，至少有10个以上的账号发布，并和西藏日喀则地震关联，有些甚至获得好几万的转评赞。

（图源：新京报）

许多网友看到图片后，为图中的孩子难受落泪，甚至都在追问，这个图片中的小孩怎么样了，并未留意到可能的疑点。

（图源：新京报）

经查证上述图片是由AI工具创作，原作者在2024年11月18日发布了相同画面的短视频，并且声明了是由AI生成。然而，社交平台的传播能力太过强大，部分内容在分发时丢失了原始重要信息，导致错误的内容被不断转发与讨论，无形中为虚假信息甚至谣言的传播创造了温床。

易盾安全专家在此提醒：AI生成的虚假灾情图片可能会影响救灾资源分配，转发时需慎重甄别。

01AI生成内容泛滥，监管持续加强

其实，AI生成虚假照片已经是老生常谈的问题了。去年某品牌手机的“AI去衣”事件、海外知名歌手泰勒·斯威夫特假裸照事件等，无不引起业内对AI生成虚假信息的担忧。

《2024人工智能安全报告》提到：人工智能技术的恶意使用将快速增长，在政治安全、网络安全、物理安全和军事安全等方面将构成严重威胁。《2024人工智能安全报告》还显示：2023年基于AI的深度伪造欺诈暴增了3000%，基于AI的钓鱼邮件增长了1000%...

基于此，国家相关部门做出迅速反应，《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》等一系列法规相继落地，对AI生成内容做了细致规定。比如《互联网信息服务深度合成管理规定》侧重四个方向：深度合成技术研发前需通过伦理评估、深度合成技术的非法应用禁止、确保深度合成技术使用的非误导性、内容平台内容审核与假消息筛查义务。其中确保深度合成技术使用的非误导性，就明确了“生成式内容标识”相关细节。

（《互联网信息服务深度合成管理规定》中对于“生成式内容标识”的截图）

为配合前述法规的落地实行，在具体标识方法上，TC260全国网安标委于当年配套发布了的《网络安全标准实践指南——生成式人工智能服务内容标识方法》（以下简称《实践指南》）。该《实践指南》明确了文本、图片、音频、视频等四类生成内容的标识方法，包括显式水印、隐式水印等标识方式，以及标识信息的其他具体要求。该《实践指南》为后续的“内容标识”专项法规及强制国家标准奠定了基础。

（《实践指南》官网及内容截图）

在《实践指南》对外发布一年之际，国家互联网信息办公室在2024年9月14日连发2条重要通知，《人工智能生成合成内容标识办法（征求意见稿）》（以下简称《办法》）、《网络安全技术人工智能生成合成内容标识方法》强制性国家标准（征求意见稿）（以下简称《方法》）同时对外征求意见。《办法》和《方法》分别从法律法规、强制国家标准层面，丰富完善了内容标识的相关要求。

（《办法》和《方法》官网截图）

易盾安全专家在此提醒：《办法》和《方法》目前处于意见收集结束后的审批阶段，相信在不久的将来会落地实施。我们希望更多的内容创作者能关注并遵守这些规定，同时我们也呼吁，各网络平台应承担相关责任，尽到内容监管与治理的义务。

02技术奔放发展，安全“守门人”不可或缺

随着国内大模型技术的成熟，AIGC逐渐成为内容生产的新引擎，并带来了内容生产力的几何倍增长，由AI生成的内容开始频繁出现在普通人的日常生活中。就像历史上每一次新技术的诞生那样，AI技术也会带来新的风险挑战：虚假信息、恶意内容、网络欺诈，都成为了黑灰产收割普通人的“利器”，无形中也提升了数字内容风控的难度。

作为网易数智旗下的数字内容风控服务商，网易易盾在PGC/UGC时代积攒的技术能力和经验已经完美地与AIGC进行结合，并在2023年初就发布了AIGC内容安全解决方案。

（易盾AIGC内容风控最佳实践）

AI内容生成相比于常规，具有数量大、类别多、更新快的特点。网易易盾从网络热梗“用魔法打败魔法”中汲取灵感，将其中的智慧运用并发展出“用AI力量治理AI”的路线。在近2年的行业实践中，我们从拒绝回答正确率、整体机审准确率、客诉率降低三方面为客户实现了防范价值。

针对本次事件提到的深度合成内容问题，易盾推出专项识别能力“AI生成识别”，支持针对人脸伪造（侧重人脸替换局部特征）、AI生成图片识别（侧重图片整体为AI生成的识别），有效帮助用户预防AI生成下的欺诈风险。

（由易盾检测出的AI生成的图片样张）

我们也真心希望，AI技术在未来可以有温度、有善意，而不是利用它伪造苦难，收割普通人心底那片最纯稚的真心。

—— END ——

/ 关于我们 /

干货资料免费领取

扫描下方二维码即可免费领取！