最近,美国国家情报总监办公室 (ODNI) 公布了一项新的开源情报 (OSINT) 战略,并将 OSINT 称为“第一手段的情报”。公共和私营部门组织正在意识到该学科(OSINT)可以提供的价值,但也发现近年来数字数据的指数增长已经压垮了许多传统的开源情报方法。值得庆幸的是,人工智能 (AI) 和机器学习 (ML) 开始对信息收集和分析的未来产生变革性影响。
什么是开源情报 (OSINT)?
开源情报是指从公开来源收集和分析信息。这些来源可以包括传统媒体、社交媒体平台、学术出版物、政府报告以及任何其他可公开访问的数据。OSINT 的关键特征是它不涉及隐蔽或秘密的信息收集方法,例如人类情报或社会工程。如果我在为美国政府工作期间可以获得数据,但作为平民而无法获得数据,那就不是开源情报。
从历史上看,开源情报一直是一个劳动密集型过程,涉及几个关键步骤:
(1)数据源确定(Identification of sources):分析师确定哪些公共来源可能包含相关信息。
(2)数据收集(Data Collection):通常通过手动搜索或网络抓取工具从这些来源收集信息。
(3)数据处理(Data processing):将收集到的信息进行组织和结构化以供分析。
(4)数据分析(Data Analysis):熟练的分析师检查数据以识别模式、趋势和见解。
(5)最终交付(Reporting):调查结果被汇编成报告供决策者做出更明智的决策。
虽然有效,但这种方法面临着可用信息量巨大的限制。人类分析师很难手动处理所有事情,有价值的见解可能隐藏在人类难以察觉的复杂模式中。这就是人工智能/机器学习可以在如何收集、处理和分析信息方面提供巨大好处的地方,从而使人类分析师能够专注于他们独特的能力,例如提供背景信息。作为一个附带好处,这种转变通常会提高士气,因为人们花在日常处理任务上的时间更少,而有更多的时间分析和审查信息。
AI/ML 可以立即带来好处的任务包括:
(1)处理海量数据(Handing Massive Data):人工智能系统可以以远远超出人类能力的速度处理和分析大量数据。这使得开源情报从业者能够撒下比以前更广泛的网,并且仍然可以处理结果。
(2)实时分析(Real-time Analysis):当今数字世界的信息流数量惊人。由人工智能驱动的 OSINT 工具可以实时监控和分析数据流,提供最新情报并能够对新出现的情况做出快速响应。
(3)多语言和多模式分析(Multilingual and Multimodal Analysis):人工智能可以通过同时翻译和分析多种语言的内容来打破语言障碍。此外,它还可以集成处理文本、图像、音频和视频等多种数据类型,提供更全面的情报图景。其中许多功能(例如 OpenAI 的 Whisper)可以离线使用,从而消除了对操作安全性 (OPSEC) 的任何担忧。
(4)预测分析(Predictive Analytics):通过分析历史数据和当前趋势,人工智能可以帮助预测未来的事件或行为,为开源情报添加主动维度。
(5)日常任务的自动化(Automation of Routine Tasks):人工智能可以帮助自动化开源情报的许多耗时的方面,例如数据收集和初始过滤,从而使人类分析师能够专注于更高级别的分析和决策。
以前很难甚至不可能实现的事情,例如准确的情绪分析,现在变得微不足道。
虽然没有任何技术是完美的,并且在实施人工智能之前我们必须考虑幻觉可能导致的潜在后果,但目前用于 OSINT 的关键技术包括:
1.自然语言处理 (NLP)
NLP 允许机器理解、解释和生成人类语言。在 OSINT 中,NLP 对于以下方面至关重要:
(1)社交媒体帖子的情绪分析
(2)实体识别,用于识别文本中的人员、组织和位置
(3)用于对大量文本数据进行分类的主题建模
(4)用于多语言情报收集的机器翻译
2.计算机视觉(Computer Vision)
该技术使机器能够解释和分析视觉信息。在 OSINT 中,计算机视觉用于:
(1)图像和视频中的面部识别
(2)面部比较以确定多张图像中是否出现同一个人
(3)图像中的物体检测
(4)光学字符识别 (OCR) 从图像中提取文本
(5)视频片段中的场景理解
3.机器学习和数据挖掘(Machine Learning and Data Mining)
您听过多少次“不懂历史的人注定会重蹈覆辙”?机器学习是该概念的化身,因为它允许系统从数据中学习并随着时间的推移提高其性能。在 OSINT 中,它们用于:
(1)预测分析以预测趋势或事件
(2)异常检测以识别异常模式或行为
(3)对数据进行聚类和分类,以便于分析
(4)网络分析以了解实体之间的关系
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...