近日,英特尔宣布开源 ControlFlag,这是其在去年 12 月推出的机器编程研究系统,它可以自主检测代码中的错误,帮助开发者进行耗时费力的 Debug。
GitHub 地址:https://github.com/IntelLabs/control-flag (ControlFlag 目前适用于 Linux 和 Mac OS,对 Windows 的支持正在努力中。)
ControlFlag 检测 Bug 的功能是通过机器编程实现的,其中融合了机器学习、形式化方法、编程语言、编译器和计算机系统。
具体来说,ControlFlag 通过被称为异常检测(anomaly detection)的功能进行运转。它通过学习经过验证的例子来检测正常的编程模式,发现代码中可能造成 Bug 的异常。此外,官方称不管代码使用什么编程语言,ControlFlag 都可以检测这些异常。
据了解,ControlFlag 的无监督模式识别方法的一个主要优势是,它可以从本质上学会适应开发者的风格。在有限的需要评估的控制工具输入信息中,ControlFlag 可以识别编程语言中的各种风格,类似于读者识别英语中使用完整单词和缩略语的差异。该工具会学会识别并标记这些风格选择,并根据其洞察可以自制错误识别和建议解决方案,从而让 ControlFlag 尽可能避免把两个开发团队之间的风格差异认为是代码错误。
英特尔实验室首席人工智能科学家 Justin Gottschlich 负责带领该工具的开发工作,他表示,自推出以来,ControlFlag 已在生产级软件和广泛使用的开源软件系统上进行了测试。
例如,2020 年 ControlFlag 曾发现 cURL 中的代码异常,cURL 是一个知名的开源项目,在全世界有超过 100 亿的安装,每天处理各种网络协议传输数据超过 10 亿次。“在我们向 cURL 团队报告异常后,他们认可 ControlFlag 的发现并随后修复了代码。”
Justin Gottschlich 还举例道,最近 ControlFlag 通过在专有生产级软件中识别数百个与内存和潜在系统崩溃错误相关的缺陷,取得了最先进的成果。此外,ControlFlag 在几个高质量的开源软件存储库中发现了数十个新的异常。到目前为止,每个异常都被开源维护者确认为是真的 bug,并已得到纠正。“这些令人兴奋的结果证明了 ControlFlag 能够显着提高成本和效率。”
英特尔认为 ControlFlag 可能会被嵌入到芯片中,作为抵御错误代码的最后一道防线,以提高数据通信通道的效率。但为此,人工智能系统需要成熟,并且必须可靠到调试过程可以自动化的程度。
但这还是一个比较长远的目标。Justin Gottschlich 在接受 TheRegister采访时表示,现在 ControlFlag 主要是应用在软件中。如果可以的话,团队很愿意构建更先进的系统或一些核心组件将它们“烧录”到硬件中,这对于机器学习来说是至关重要的。
Gottschlich 说,英特尔正在投入更多资源来长期开发 ControlFlag,但另一个挑战是弄清楚通信、机器学习和计算将如何发展。
延展阅读:
评论