OpenAI发布开源人工智能研究工具集OpenAI Gym_Python_Jonathan Allen_InfoQ精选文章

和许多企业一样，在过去几年中，InfoSys 见证了从“大数据”到越来越重视机器学习和 AI 研究这一重大转变。但和他们的竞争者不同，InfoSys 断定，合作是更有效方式，而不是大力投资专有解决方案，比如微软的 Azure Machine Learning Studio。

这一决策的结果就是 OpenAI，一家非营利性的人工智能研究企业。自 2015 年 12 月正式成立以来，该研究组织已经从 InfoSys 、 Amazon Web Services 和多个私人捐助者那里获得了 10 亿美元的资金。

我们在这里谈论 OpenAI，是因为他们近日发布了 OpenAI Gym 的公开测试版本。该工具集用于开发和对比强化学习（RL）算法，这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因：

RL 是通用算法，适应所有涉及一系列决策的问题：例如，控制机器人的电动机，让它跑跑跳跳，做出业务决策，如价格和库存管理，或者玩视频游戏和棋盘游戏。RL 甚至适用于产生序列化或结构化输出的监督学习问题。

在许多不同的环境中，RL 算法已经开始取得很好的成果。RL 有很长的历史，但在深度学习取得最新进展之前，它都需要针对特定问题进行大量的设计。DeepMind 的 Atari 成果、来自 Pieter Abbeel 研究小组的 BRETT 以及 AlphaGo 都使用了深度 RL 算法，并且没有对它们的应用环境做太多的假设，因此可以应用在其他场合。

目前，RL 研究的发展受到了限制，它需要更好的基准测试，而且“出版物中缺少标准化的环境”。不难想象，当另一位科学家的研究论文假定你可以使用一套专有的工具集，你就很难再现他的结果。更糟糕的是，一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本，还因为没有一个共同的环境，比较两个算法就没有意义。因此，OpenAI Gym 提供了这些开箱即用的环境： Classic control 、 Toy text 、 Algorithmic 、 Atari （基于 Arcade 学习环境）、棋盘游戏和 2D/3D 机器人（最后一项需要一个 MuJoCo 物理引擎许可。）

目前，OpenAI Gym 在 Linux 和 OSX 上支持 Python 2.7。如果大家有足够的兴趣，他们也会考虑支持 Python 3 和 Windows。该工具集的代码遵循 MIT 许可协议。

查看英文原文： Open Sourcing Artificial Intelligence Research

评论

发布

暂无评论

跨平台开发成为移动应用程序开发趋势

没有用户名丶

交易系统之数据库弱依赖解决方案

京东科技开发者

数据库高并发灾备 db 企业号 3 月 PK 榜

Last Week in Milvus

Milvus Zilliz 向量数据库

使用抓包工具Wireshark分析IoT设备网络行为——设备管理运维类

网络协议物联网网络性能优化

喜讯｜百度入选“移动互联网APP产品安全漏洞治理”优秀案例

企业不想走弯路，不如试试低代码开发

低代码低代码开发 JNPF

SpringBoot项目就连创建目录都让人抓狂

做梦都在改BUG

Java Spring Boot 框架

ElasticSearch必知必会-Reindex重建索引

京东科技开发者

elasticsearch 索引 ES 集群企业号 3 月 PK 榜

OPPO、京东云 loT 项目数据架构改造，数据处理痛点这样破解

tdengine 数据架构时序数据库用户案例 loT

CleanMyMac4.20专业的mac清理软件

中国流程挖掘迎来新“启点”，望繁信科技全面升级

ToB行业头条

订阅标识符与订阅选项--MQTT 5.0新特性

EMQ映云科技

物联网 IoT mqtt 订阅企业号 3 月 PK 榜

国家中心城市手机银行发展洞察

金融经济手机银行城市

你值得拥有的IoT 物联网平台开发实用技巧(一)——数据价值类

AntDB数据库助力中国移动华南中心计费项目

亚信AntDB数据库

AntDB 国产数据库 aisware antdb AntDB数据库企业号 3 月 PK 榜

金三突击面试，收获6个Offer，原来面试还能这么简单！

做梦都在改BUG

Java java面试 Java八股文 Java面试题 Java面试八股文

K8S部署应用详解

设备使用HTTPS协议接入IoT物联网平台——设备接入类

支付宝小程序-MQTT模拟器体验阿里云IoT开发——设备接入类

Acrobat Pro DC 2023发布，有哪些新的改进？

adobe pdf编辑器 Acrobat Pro DC 2023

直播教学！20 分钟开发可视化「智能门铃」丨RTE 开发实战课 • 第一期

最佳实践直播 RTC 声网

业务架构那点事(2)如何通过高层访谈获取企业战略信息?

涛哥数字产品和业务架构

业务架构访谈

React数字滚动组件 numbers-scroll

JavaScript 前端监控 React

亿级用户中心的设计与实践

做梦都在改BUG

Java 服务架构亿级流量用户中心

通过Flutter实现一个能在多端运行的扫雷游戏

编程的平行世界

flutter 前端游戏移动端扫雷

VPN客户端Shimo mac版使用教程：如何创建新的 VPN 帐户？

vpn mac系统 Shimo下载 Shimo教程

面面俱到！四面阿里拿offer后，才发现师哥给的面试笔记有多强大

做梦都在改BUG

Java java面试 Java八股文 Java面试题 Java面试八股文

真香！阿里最新出品Java面试核心讲（终极版），Github已星标50K

程序员小毕

Java 程序员面试后端架构师