本系列文章最初发表在 TowardsDataScience 博客,经原作者 Ensar Seker 授权,InfoQ 中文站翻译并分享。
从自主工具到虚拟助手,从聊天机器人到人脸/物体识别,近年来,机器学习已经取得了长足的进步。这是事实。那网络安全呢?《网络安全的未来是否掌握在人工智能手中?》系列文章将深入探讨网络安全与AI的关系,本文是系列专栏的第一篇。
在中国哲学中,阴阳代表着看似对立的两极如何互补,达到和谐。
在网络安全领域中,这一古老的哲学完美地代表了有监督学习和无监督学习之间的关系。例如,有监督的机器学习过程可以用于检测;而无监督的机器学习使用聚类。在网络安全和数据安全的研究和开发中,受监督的机器学习通常以机器学习算法的形式实现。
要描述人工智能并不容易,因为它没有明确的定义。现有的大多数定义,都是试图将人工智能表述为一种模仿人类智慧和行为,并智能行动的计算机过程。但这样的定义带来了更多的疑问,比如,什么是智慧?人类总是表现得聪明而合乎逻辑吗?人工智能的理想目标是人类智能吗?或者,计算机能做到比人类表现得更好吗?将人工智能建立在理性行为基础上的方法的定义,指的是计算机做一些人类很难做到的事情。然而,在本文中,笔者采用了务实的方法来简化这个问题,并将人工智能界定为一个科学领域,负责针对人类难以找到解决方案的复杂问题,提出基于计算机的解决方案。
人工智能技术全景图
AI 技术全景图
人工智能在网络安全方面的应用还相对较新。虽然一些网络安全专家认为,网络安全的答案是使用机器学习来检测复杂的漏洞,而且只有在基于人工智能的解决方案的帮助下确保 IT 环境的安全,网络安全才会继续取得成功。而其他人则认为,虽然机器学习在寻找相似性方面非常出色,但在检测异常情况方面还不够好,因此并不适合网络安全。
除了这些讨论之外,从自主工具到虚拟助手,从聊天机器人到人脸/物体识别,近年来,机器学习已经取得了长足的进步。这是一个事实。随着我们迈向网络安全更多地融入人们日常生活的未来,重要的是要意识到基于机器和深度学习的不同方法,以便更好地保护网络和数据安全,抵御日益复杂和先进的攻击。
你可能已经知道,训练机器神经网络的机器算法有四种:有监督学习、无监督学习、半监督学习(也称为主动学习)、强化学习。有监督学习是指从训练数据集中学习;无监督式机器是从数据本身学习,而数据本身检测威胁的能力有限,因为它只寻找以前看到和标记的细节;而无监督学习不断扫描网络并发现异常。然而,无监督学习无需标记的训练数据,因此更适合检测可疑活动,包括检测以前从未观察到的攻击行为。
机器学习算法
作为网络安全系统的一部分,机器学习已被用来减少攻击检测和防御工具可以处理的负载。人工智能算法类似于真实的人类决策机制,试图对决策机器进行建模。
人们已经进行了许多尝试,试图替代无人值守的机器学习安全解决方案,带来了针对各种安全问题的解决方案,但这些解决方案未经测试。许多早期的尝试都难以生成足够的数据,并不能有效地发现复杂的漏洞,如身份欺诈或先进的网络攻击。
相比之下,无监督学习是指发现和描述数据中隐藏的结构。这个问题与定义距离函数的问题有关,因为大多数(如果不是全部的话)聚类算法都是基于数值和非分类数据的,因此,我们对聚类算法的了解和对分类的了解一样多。
在网络安全的背景下,人工智能试图通过权衡表明系统受到威胁的行为模式来保护系统。从这个角度来看,机器学习就是导致恶意行为的学习模式的过程。
在信息安全领域,人工智能解决方案一般以分析师为导向,以无监督机器学习为重点。使用无监督式的机器学习来检测罕见或异常的模式,可以增加对新攻击的检测。然而,它也可能会引发更多的误报和警告。这需要大量的分析工作来调查这些误报的准确性。这种误报会造成警报疲劳和不安全感,而且随着时间的推移,还会导致其重新采用以分析为中心的解决方案,从而由此产生缺陷。信息安全行业面临的三大挑战,每一个挑战都可以通过机器学习解决方案来解决,这些已确定的挑战具体如下:
标记数据的缺失:许多组织缺乏使用以前攻击的标记示例和有监督学习模型的能力。
不断演变的攻击:即使可以控制学习模型,攻击者也可以改变他们的行为并“覆盖”它们。
研究或调查的时间和预算有限:申请分析师调查攻击既昂贵又耗时。
由于业界仍在尝试将该技术作为概念验证,然而,在安全解决方案是机器学习的情况下,信任的想法是理想的。它可以帮助提高打击网络犯罪的力度,而人工智能可以通过自动化模式识别过程来促进人类的努力。机器学习系统根据类别报告有用的数据,而分析师则公开谈论机器学习如何成为安全的黑匣子解决方案,而首席信息安全观们并不十分清楚幕后是怎么回事。
今天,人工智能还没有准备好替代人类,但通过自动化模式识别过程,它可以增强人类的努力。这里有一个不可否认的事实,因为机器学习在网络防御中有着非常不同的用途。
考虑到所有的使用领域,可以将人工智能在网络空间的分为两类:一类是利用人工智能进行网络防御,另一类是利用人工智能进行网络进攻。
在第二篇文章中中,我们将讨论人工智能在网络防御中的应用。
参考文章:
[1] 《人工智能基础》(Fundamentals of Artificial Intelligence),K.R. Chowdhary,Springer India,2020 年。
[2] 《AI2:训练大数据机器防御》(AI2: Training a Big Data Machine to Defend),K. Veeramachaneni、I. Arnaldo、A. Cuesta-Infante、V. Korrapati、C. Bassias、K. Li,IEEE 大数据国际安全会议,纽约,2016 年。
作者介绍:
Ensar Seker,安全研究员。
原文链接:
延伸阅读:
评论