开源软件已成为数字世界的基石,其爆发式增长在加速创新的同时,也急剧扩大了软件供应链的攻击面。 海量二进制文件中潜藏的过时组件、未披露漏洞,如同隐蔽的“供应链地雷”,严重威胁着业务安全。传统依赖规则、特征码或人力的分析手段,面对碎片化、多态化的二进制世界,深陷效率低下、覆盖不足、响应滞后的困境。Log4j、Spring4Shell等重大漏洞的频发,更凸显了在二进制层实现智能化深度分析的迫切性。
直面这一核心挑战,XCon2025大会中,来自腾讯安全科恩实验室的安全研究员蒋灵,将带来议题《BinaryAI:大模型时代下的二进制安全智能化分析》。深度阐述如何依托团队自研的二进制函数语义匹配大模型核心引擎,引领安全的智能化变革。该模型将二进制代码与源代码映射至同一高维语义空间,精准捕捉跨形态的深层语义关联,高效应对传统分析中语义鸿沟的难题。
这一突破不仅提升了函数相似度计算与检索的精度,更成为支撑高精度软件成分分析(SCA)、免特征码的下一代恶意文件检测、智能溯源与可解释报告等核心能力的智能化底座,为构建主动、精准、高效的软件供应链安全防线奠定了坚实基础。
议题简介
技术要点
二进制函数语义匹配大模型:科恩自研大模型,实现了将二进制和源代码特征映射到同一高维向量空间得到其函数向量,并相应地进行二进制到源代码函数的相似度计算和检索匹配。基于底座模型构建了BinaryAI的各项下游任务。
二进制软件成分分析:二进制软件成分分析作为一项重要的软件工程实践,通过对软件构件进行审查,识别二进制中所包含的第三方代码库及其版本号,帮助确定许可证合规性问题和潜在的1-day安全漏洞。
恶意文件检测:BinaryAI的恶意文件检测引擎创新性地探索了一套基于语义化的查杀引擎技术,通过大模型相关技术实现端到端文件检测。这一技术的核心优势在于其无需依赖任何特征码或特征工程,已在威胁情报海量文件数据上进行了全面的训练,确保其具备准确性。BinaryAI的恶意文件检测引擎可以灵活应对新型恶意软件的威胁,将会大幅提升恶意软件检测的时效性和可解释性。
技术创新点
BinaryAI大模型在多个二进制安全领域实现了突破性创新。
首先,通过将二进制和源代码特征映射到同一高维向量空间,完成了二进制与源代码函数的语义匹配和相似度计算,从而提升了二进制到源代码函数的检索精度。
此外,基于这一底座模型,BinaryAI增强了二进制软件成分分析(SCA),通过精准识别第三方代码库及其版本号,协助解决许可证合规性和潜在的安全漏洞问题。
在恶意文件检测方面,创新性地采用基于语义化的查杀引擎,依靠大模型技术实现端到端的文件检测,无需依赖特征码或传统特征工程,极大提升了新型恶意软件检测的时效性和准确性。
这些创新有效提升了二进制安全领域的智能化水平,推动了检测、分析和响应的自动化与精度。
演讲人介绍
腾讯安全科恩实验室是腾讯旗下一支国际一流的信息安全团队,基于前沿安全研究持续创新,融合攻防+大数据+算法打造行业领先安全能力基座,领航产业主动防御体系建设,在车联网安全、工业互联网安全、AI安全和威胁情报等前沿方向,科恩技术实力和研究成果达到了国际领先水平。科恩实验室还参与了多个开源项目,并与学术界、产业界保持密切合作,已发布十余篇研究成果于AAAI、NeurIPS、 USENIX Security等各大顶会。
腾讯云安全威胁情报中心构建了"攻防+大数据+算法"驱动的威胁情报生产运营和发布体系,通过全域数据整合、专业化威胁分析、自动化运营发布,实现每日千万级威胁精准识别与处置。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...