在「大模型安全与对齐」主题论坛上,网易易盾AI算法负责人李雨珂深入解读了AIGC时代数字内容风控的核心技术,其中一项能力成为本次会议关注焦点。
作为网易易盾最新发布的重点能力——AI生成识别检测,其技术深度与应用广度备受瞩目。雨珂博士现场揭秘了底层实现原理及应用效果,其标注检测模型采用“显性标识识别+隐性标识识别”双通道,全面覆盖图片、文档、点播视频、点播音频等主流内容形态,实现从生成到传播的全链路合规管控,覆盖三大核心场景:
人脸伪造识别,聚焦人脸局部特征判断是否换脸,支持图像与视频检测;
AIGC生成图识别,通过整体特征分析辨别AI生成图像,适配图像与视频场景;
声纹伪造识别,针对机器语音转换、合成的音频进行检测,覆盖音频及视频中的音频内容。
技术上,依托垂直领域文本大模型、VL大模型、细粒度标签大模型、OCR大模型等基座,通过样本泛化生成、跨模态对齐等技术,目前易盾已将安全模型训练时长压缩至天级别,单标签精度显著提升,以应对日益复杂的网络环境。性能上,核心API准确率达99.8%,年过滤数据超1万亿次,精细化分类达300+,既能满足生成内容标识的法规要求,又能有效预防AI诈骗、保护隐私与版权。
关于我们
免费下载干货资料
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...