写点什么

OpenAI 发布开源人工智能研究工具集 OpenAI Gym

  • 2016-05-03
  • 本文字数:916 字

    阅读完需:约 3 分钟

和许多企业一样,在过去几年中,InfoSys 见证了从“大数据”到越来越重视机器学习和 AI 研究这一重大转变。但和他们的竞争者不同,InfoSys 断定,合作是更有效方式,而不是大力投资专有解决方案,比如微软的 Azure Machine Learning Studio。

这一决策的结果就是 OpenAI,一家非营利性的人工智能研究企业。自 2015 年 12 月正式成立以来,该研究组织已经从 InfoSys Amazon Web Services 和多个私人捐助者那里获得了 10 亿美元的资金。

我们在这里谈论 OpenAI,是因为他们近日发布了 OpenAI Gym 的公开测试版本。该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因:

RL 是通用算法,适应所有涉及一系列决策的问题:例如,控制机器人的电动机,让它跑跑跳跳,做出业务决策,如价格和库存管理,或者玩视频游戏棋盘游戏。RL 甚至适用于产生序列化结构化输出的监督学习问题。

在许多不同的环境中,RL 算法已经开始取得很好的成果。RL 有很长的历史,但在深度学习取得最新进展之前,它都需要针对特定问题进行大量的设计。DeepMind 的 Atari 成果、来自 Pieter Abbeel 研究小组的 BRETT 以及 AlphaGo 都使用了深度 RL 算法,并且没有对它们的应用环境做太多的假设,因此可以应用在其他场合。

目前,RL 研究的发展受到了限制,它需要更好的基准测试,而且“出版物中缺少标准化的环境”。不难想象,当另一位科学家的研究论文假定你可以使用一套专有的工具集,你就很难再现他的结果。更糟糕的是,一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本,还因为没有一个共同的环境,比较两个算法就没有意义。因此,OpenAI Gym 提供了这些开箱即用的环境: Classic control Toy text Algorithmic Atari (基于 Arcade 学习环境)、棋盘游戏 2D/3D 机器人(最后一项需要一个 MuJoCo 物理引擎许可。)

目前,OpenAI Gym 在 Linux 和 OSX 上支持 Python 2.7。如果大家有足够的兴趣,他们也会考虑支持 Python 3 和 Windows。该工具集的代码遵循 MIT 许可协议。

查看英文原文: Open Sourcing Artificial Intelligence Research

2016-05-03 19:006427
用户头像

发布了 1008 篇内容, 共 393.1 次阅读, 收获喜欢 345 次。

关注

评论

发布
暂无评论
发现更多内容

全网都刷爆了,不会只有你不知道吧—,android智能手机编程答案

android 程序员 移动开发

关于MVC_MVP_MVVM的一些错误认识,android面试流程

android 程序员 移动开发

关于使用 Android MVVM + LiveData 模式的一些建议,ffmpeg音视频同步

android 程序员 移动开发

关于拼多多被曝删除用户本机照片的一点想法(1),android程序设计基础

android 程序员 移动开发

这本“算法宝典”讲得透彻,完全掌握后,我竟拿到字节跳动offer

程序员 算法 字节

内存泄漏以优化大全,2021非科班生的Android面试之路

android 程序员 移动开发

写给Android开发者的混淆使用手册,程序员工作2年月薪12K

android 程序员 移动开发

入职两年的安卓“程序员“跳槽,2021年阿里Android面试题精选

android 程序员 移动开发

再见!onActivityResult!你好,android开发电子书阅读器

android 程序员 移动开发

关于程序员35岁的坎:年龄不是挡板,当你匹配了这个年纪该有的能力还有什么畏惧

android 程序员 移动开发

关于Android的渲染机制,大厂面试官最喜欢问的7个问题【建议收藏

android 程序员 移动开发

关于大厂Android面试必问的事件分发机制,应该没有比这篇讲的更好的了

android 程序员 移动开发

再见!杭州!再见,kotlin数组fold方法

android 程序员 移动开发

全面复盘Android开发者容易忽视的Backup功能 _ 创作者训练营第二期

android 程序员 移动开发

05 K8S之kubeadm介绍

穿过生命散发芬芳

k8s 11月日更

写给软件工程师的 30 条建议,9次Android面试经验总结

android 程序员 移动开发

兄弟们,这年头,咱移动客户端工程师还有前途吗,flutter图片压缩上传

android 程序员 移动开发

毕业设计—电商秒杀系统

俊杰

架构实战营

全面!2020华为Android岗面试真题(已解析含答案,android蓝牙开发框架

android 程序员 移动开发

架构实战营-模块九-毕业设计

Cingk

区块链上的房地产:区块链会颠覆房地产吗?

CECBC

再见!onActivityResult!你好(1),太现实了

android 程序员 移动开发

写代码还是做管理?安卓开发者的困扰,一文全懂

android 程序员 移动开发

架构训练营第1期 毕业总结

高远

六年Android从迷茫到大牛的成长之路,不忘初心,方得始终

android 程序员 移动开发

关于 Flutter 是不是“大有可为”这件事,androidjetpack教程

android 移动开发

关于拼多多被曝删除用户本机照片的一点想法,移动服务框架app下载安装

android 程序员 移动开发

元宇宙,如何看待它就是下一代互联网(附下载)

CECBC

写给即将正在找工作的Android攻城狮,移动客户端开发面经

android 程序员 移动开发

几乎包含了市面上所有启动优化方案,学习路线+知识点梳理

android 程序员 移动开发

全面理解 Flutter(万字长文,深度解析,整理了3家面试问题:美团+字节+腾讯

android 程序员 移动开发

OpenAI发布开源人工智能研究工具集OpenAI Gym_Python_Jonathan Allen_InfoQ精选文章