此篇文章发布距今已超过1天,您需要注意文章的内容或图片是否可用!
2025年1月7日9时5分,西藏自治区定日县发生6.8级地震,灾情牵动了全国人民的心,许多网友在社交平台上为灾民祈福。但与此同时,一些疑似虚假的信息正在传播,造成广泛误导。比如下面这张图片:一个戴帽子的小孩被重压在倒塌的建筑物下,在某短视频平台上,至少有10个以上的账号发布,并和西藏日喀则地震关联,有些甚至获得好几万的转评赞。(图源:新京报)
许多网友看到图片后,为图中的孩子难受落泪,甚至都在追问,这个图片中的小孩怎么样了,并未留意到可能的疑点。
经查证上述图片是由AI工具创作,原作者在2024年11月18日发布了相同画面的短视频,并且声明了是由AI生成。然而,社交平台的传播能力太过强大,部分内容在分发时丢失了原始重要信息,导致错误的内容被不断转发与讨论,无形中为虚假信息甚至谣言的传播创造了温床。易盾安全专家在此提醒:AI生成的虚假灾情图片可能会影响救灾资源分配,转发时需慎重甄别。其实,AI生成虚假照片已经是老生常谈的问题了。去年某品牌手机的“AI去衣”事件、海外知名歌手泰勒·斯威夫特假裸照事件等,无不引起业内对AI生成虚假信息的担忧。《2024人工智能安全报告》提到:人工智能技术的恶意使用将快速增长,在政治安全、网络安全、物理安全和军事安全等方面将构成严重威胁。《2024人工智能安全报告》还显示:2023年基于AI的深度伪造欺诈暴增了3000%,基于AI的钓鱼邮件增长了1000%...基于此,国家相关部门做出迅速反应,《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》等一系列法规相继落地,对AI生成内容做了细致规定。比如《互联网信息服务深度合成管理规定》侧重四个方向:深度合成技术研发前需通过伦理评估、深度合成技术的非法应用禁止、确保深度合成技术使用的非误导性、内容平台内容审核与假消息筛查义务。其中确保深度合成技术使用的非误导性,就明确了“生成式内容标识”相关细节。(《互联网信息服务深度合成管理规定》中对于“生成式内容标识”的截图)
为配合前述法规的落地实行,在具体标识方法上,TC260全国网安标委于当年配套发布了的《网络安全标准实践指南——生成式人工智能服务内容标识方法》(以下简称《实践指南》)。该《实践指南》明确了文本、图片、音频、视频等四类生成内容的标识方法,包括显式水印、隐式水印等标识方式,以及标识信息的其他具体要求。该《实践指南》为后续的“内容标识”专项法规及强制国家标准奠定了基础。
(《实践指南》官网及内容截图)
在《实践指南》对外发布一年之际,国家互联网信息办公室在2024年9月14日连发2条重要通知,《人工智能生成合成内容标识办法(征求意见稿)》(以下简称《办法》)、《网络安全技术 人工智能生成合成内容标识方法》强制性国家标准(征求意见稿)(以下简称《方法》)同时对外征求意见。《办法》和《方法》分别从法律法规、强制国家标准层面,丰富完善了内容标识的相关要求。易盾安全专家在此提醒:《办法》和《方法》目前处于意见收集结束后的审批阶段,相信在不久的将来会落地实施。我们希望更多的内容创作者能关注并遵守这些规定,同时我们也呼吁,各网络平台应承担相关责任,尽到内容监管与治理的义务。02技术奔放发展,安全“守门人”不可或缺
随着国内大模型技术的成熟,AIGC逐渐成为内容生产的新引擎,并带来了内容生产力的几何倍增长,由AI生成的内容开始频繁出现在普通人的日常生活中。就像历史上每一次新技术的诞生那样,AI技术也会带来新的风险挑战:虚假信息、恶意内容、网络欺诈,都成为了黑灰产收割普通人的“利器”,无形中也提升了数字内容风控的难度。
作为网易数智旗下的数字内容风控服务商,网易易盾在PGC/UGC时代积攒的技术能力和经验已经完美地与AIGC进行结合,并在2023年初就发布了AIGC内容安全解决方案。
AI内容生成相比于常规,具有数量大、类别多、更新快的特点。网易易盾从网络热梗“用魔法打败魔法”中汲取灵感,将其中的智慧运用并发展出“用AI力量治理AI”的路线。在近2年的行业实践中,我们从拒绝回答正确率、整体机审准确率、客诉率降低三方面为客户实现了防范价值。针对本次事件提到的深度合成内容问题,易盾推出专项识别能力“AI生成识别”,支持针对人脸伪造(侧重人脸替换局部特征)、AI生成图片识别(侧重图片整体为AI生成的识别),有效帮助用户预防AI生成下的欺诈风险。(由易盾检测出的AI生成的图片样张)
我们也真心希望,AI技术在未来可以有温度、有善意,而不是利用它伪造苦难,收割普通人心底那片最纯稚的真心。 推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
ZhouSa.com-宙飒天下网
还没有评论,来说两句吧...