Facebook 最近发布了 CommAI-env ,一个用于训练和评价 AI 系统的平台。这个平台是受一个机器智能的路线图启发,旨在教授智能代理一般的学习能力,作为进一步、更专业的、通过人类或机器级的互动培训的基础。
CommAI 的工作原理是通过工作平台分配任务给学习者,如果学习者能给出正确的答案,就会再给予奖励。这种类型的互动能训练系统去通过奖励,识别正确或不正确的答案。任务千变万化,从最简单的沉默- 不沉默,到越来越复杂的、需要学习者长期记忆的任务,所有都在同一次训练环节里完成。
与 OpenAI Gym 或 MazeBase 等相似的系统相比,这是一个但不是唯一的区别因素。通过消除在训练和测试集之间的流行的界限,系统旨在概括学习者学习新的、未知的问题的能力,以及快速解决简单的、过去见过的问题的能力。
学习者算法的接口定义了两个函数。
next(self, input_bit)作为算法的输入,接收工作平台的一段输入,并且由学习者返回下一段内容。
reward(self, reward)将为学习者提供从工作平台中获得的奖励。
追逐奖励的迭代工作将在学习过去数据和适应新难题的过程中训练算法。
培训平台为开发者提供绑定,可以使用任何编程语言定义学习者通过 ZeroMQ 消息队列进行学习。该项目仍然处在 Beta 测试阶段,它有一个 Facebook 群对其进行讨论和提供支持。该平台代码是用 Python 写的,代码在 GitHub 上托管。
查看英文原文: CommAI, a Training and Testing AI System by Facebook
评论