写点什么

OpenAI 发布开源人工智能研究工具集 OpenAI Gym

  • 2016-05-03
  • 本文字数:916 字

    阅读完需:约 3 分钟

和许多企业一样,在过去几年中,InfoSys 见证了从“大数据”到越来越重视机器学习和 AI 研究这一重大转变。但和他们的竞争者不同,InfoSys 断定,合作是更有效方式,而不是大力投资专有解决方案,比如微软的 Azure Machine Learning Studio。

这一决策的结果就是 OpenAI,一家非营利性的人工智能研究企业。自 2015 年 12 月正式成立以来,该研究组织已经从 InfoSys Amazon Web Services 和多个私人捐助者那里获得了 10 亿美元的资金。

我们在这里谈论 OpenAI,是因为他们近日发布了 OpenAI Gym 的公开测试版本。该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因:

RL 是通用算法,适应所有涉及一系列决策的问题:例如,控制机器人的电动机,让它跑跑跳跳,做出业务决策,如价格和库存管理,或者玩视频游戏棋盘游戏。RL 甚至适用于产生序列化结构化输出的监督学习问题。

在许多不同的环境中,RL 算法已经开始取得很好的成果。RL 有很长的历史,但在深度学习取得最新进展之前,它都需要针对特定问题进行大量的设计。DeepMind 的 Atari 成果、来自 Pieter Abbeel 研究小组的 BRETT 以及 AlphaGo 都使用了深度 RL 算法,并且没有对它们的应用环境做太多的假设,因此可以应用在其他场合。

目前,RL 研究的发展受到了限制,它需要更好的基准测试,而且“出版物中缺少标准化的环境”。不难想象,当另一位科学家的研究论文假定你可以使用一套专有的工具集,你就很难再现他的结果。更糟糕的是,一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本,还因为没有一个共同的环境,比较两个算法就没有意义。因此,OpenAI Gym 提供了这些开箱即用的环境: Classic control Toy text Algorithmic Atari (基于 Arcade 学习环境)、棋盘游戏 2D/3D 机器人(最后一项需要一个 MuJoCo 物理引擎许可。)

目前,OpenAI Gym 在 Linux 和 OSX 上支持 Python 2.7。如果大家有足够的兴趣,他们也会考虑支持 Python 3 和 Windows。该工具集的代码遵循 MIT 许可协议。

查看英文原文: Open Sourcing Artificial Intelligence Research

2016-05-03 19:006505
用户头像

发布了 1008 篇内容, 共 401.5 次阅读, 收获喜欢 345 次。

关注

评论

发布
暂无评论
发现更多内容

还在为入门鸿蒙效率慢而困惑?不妨试试开发学习神器 - AI辅助编程

猫林老师

鸿蒙 HarmonyOS 鸿蒙应用开发 鸿蒙原生应用开发 HarmonyOS NEXT

1685页Java面试题大全(整理版)3000+面试题附答案详解,最全面详细

采菊东篱下

编程 计算机 java面试

AIGC对本地配置要求高吗,云桌面如何实现一键镜像?

青椒云桌面

AIGC云桌面 AIGC云电脑 sd云端部署

智能加氢站站控系统(源码+文档+部署+讲解)

深圳亥时科技

ATB是什么?

zjun

CANN Ascend 大模型推理

如何在c++侧编译运行一个aclnn(AOL)算子?

zjun

算子 大模型 CANN 昇腾 Ascend

HarmonyOS鸿蒙开发 - 解决上下两栏白边 - 沉浸式效果

猫林老师

HarmonyOS 鸿蒙应用开发 鸿蒙原生应用开发 HarmonyOS NEXT

VMware ESXi 8.0U3c Unlocker & OEM BIOS 标准版和厂商定制版

sysin

esxi

uniapp开发鸿蒙,是前端新出路吗?

猫林老师

前端 HarmonyOS

开辟新蓝海 华为坤灵剑指中小企业安全增量市场

Geek_2d6073

蓝宝石插件套装Boris FX Sapphire mac激活版 支持AE PS AVX OFX等

小玖_苹果Mac软件

强大Raw格式图像ps插件Adobe Camera Raw for Mac中文激活

小玖_苹果Mac软件

鸿蒙应用开发从入门到入行 - 篇7:http网络请求

猫林老师

鸿蒙 HarmonyOS 鸿蒙应用开发 鸿蒙原生应用开发 HarmonyOS NEXT

智谱清言英特尔酷睿Ultra专享版发布,离线模型玩转AIPC

E科讯

Kafka 迁移 AutoMQ 时 Flink 位点管理的挑战与解决方案

AutoMQ

如何使用Ascend的ATB加速库?

zjun

CANN Ascend 大模型推理

ATB概念之:算子tiling

zjun

CANN 数据切片 Ascend 大模型推理

VMware ESXi 8.0U3c Unlocker & OEM BIOS 集成网卡驱动和 NVMe 驱动 (集成驱动版)

sysin

esxi

0基础跟练!代码小白也能搭建自己的专属 AI 聊天助手

豆包MarsCode

AI 聊天机器人 AI编程 聊天助手 豆包MarsCode

3D渲染与动画制作的创意利器 KeyShot 2024 for mac中文激活版

小玖_苹果Mac软件

Bodymovin for Mac (AE动画导出json工具) v5.12.1英文激活版

小玖_苹果Mac软件

【万字长文】MarsCode结合 Manim 打造炫酷的算法演示动画

战场小包

Python AI 代码生成 AIGC

Axure RP 10 for Mac中文激活版:高效原型设计软件

小玖_苹果Mac软件

Antares Auto-Tune Pro for Mac(音调校正) 11.0 激活版

小玖_苹果Mac软件

开源云原生数据仓库 ByConity测试

多啦A梦

ByConity

AscendC从入门到精通系列(一)初步感知AscendC

zjun

算子 大模型 CANN AscendCL Ascend

牛客网2024版Java最新面试宝典(附答案解析)正式开源!

采菊东篱下

程序员 java面试

ATB算子实现原理解读

zjun

CANN Ascend 大模型推理

Ascend推理组件MindIE LLM

zjun

推理模型 Ascend 大模型推理

OpenAI发布开源人工智能研究工具集OpenAI Gym_Python_Jonathan Allen_InfoQ精选文章