机器学习技术利用推文预测高危安全漏洞,准确率超过80%
2019-03-14
机器学习技术将利用推文内容发现高危安全漏洞。
俄亥俄州立大学、安全厂商 FireEye 以及研究企业 Leidos 的研究人员们于近期发表了一篇论文,其中描述了一种新型系统,能够读取数百万条推文中所提及的软件安全漏洞,而后利用机器学习训练算法,对描述方式与具体内容所代表的威胁状态进行评估。他们发现,Twitter 信息不仅可用于预测接下来几天出现在国家漏洞数据库中的大多数安全漏洞(即由国家标准与技术研究所追踪的各项安全漏洞的官方登记平台),同时也能够利用自然语言处理技术,大致预测出哪些漏洞将被赋予“危险”或者“高危”严重等级,准确率超过 80%。
举例来说,他们目前正在网上进行的原型测试显示,上周 Twitter 曾出现大量与 MacOS 系统中新漏洞(被称为“BuggyCow”)相关的推文,同时也提到一种可能允许页面访问的 SPOILER 攻击方法(利用英特尔芯片中存在的某深层漏洞)。研究人员们开发的 Twitter 扫描程序将二者标记为“可能高危”,截至目前,这两项漏洞都还没有被收录至国家漏洞数据库当中。
他解释称,“我们希望构建起一款能够读取网络信息并提取新软件漏洞早期报告的计算机程序,同时分析用户对其潜在严重性的整体观看。结合实际来看,开发人员往往面对着这样一个现实难题——面对复杂的分析结果,哪个才代表着真正可能令人们遭受重大损失的高危漏洞?”
在实验当中,俄亥俄州立大学、FireEye 以及 Leidos 的研究人员们开始使用到与安全漏洞相关的 6000 条推文评论这一子集。他们向 Amazon Mechanical Turk 的工作人员展示了相关结果,即以人为方式按严重程度对其进行排序,而后过滤掉那些与大多数其他读者完全对立的异常结果。
俄亥俄州立大学的 Ritter 警告称,尽管目前的测试结果非常喜人,但他们打造的这款自动化工具不应被任何个人或组织作为唯一漏洞数据源使用——至少,人们应该点击底层推文及其链接信息以确认分析结果。他指出,“其仍然需要人类介入进来。”在他看来,是能将这款程序纳入由人类负责规划的广泛漏洞数据源当中,并仅作为来源之一。