HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

谷歌发布开源 Dopamine 2.0,让强化学习变得更灵活

  • 2019-02-09
  • 本文字数:715 字

    阅读完需:约 2 分钟

谷歌发布开源Dopamine 2.0,让强化学习变得更灵活

强化学习(RL)已成为最受欢迎的机器学习领域之一,并且在过去几年中取得了许多重大进展。因此,研究人员和教育工作者越来越需要获得一个清晰可靠的 RL 研究和教育框架。去年 8 月,谷歌发布了一款全新的开源强化学习框架 Dopamine,该框架基于 TensorFlow,主打灵活性、稳定性、复现性,能够提供快速的基准测试。


今天,谷歌发布 Dopamine 2.0,为强化学习提供了更高的灵活性以及更多的测试环境。


去年八月,谷歌发布了 Dopamine,这是一款灵活的强化学习框架。初始版本专注于特定类型的 RL 研究:基于 Arcade 学习环境(一个成熟的、易于理解的基准)和四个基于值的代理 DQN、C51、Rainbow 代理的简化版本以及隐式分位数网络代理实现的。


开源地址:https://github.com/google/dopamine


据官方博客介绍:


开发小组收到的最常见的请求之一是对更多环境的支持。这证实了他们在内部看到的情况,在测试新算法时,OpenAI 的 Gym 支持的简单环境非常有用。于是,谷歌正式发布 Dopamine 2.0,这一版本包括了对离散域 Gym 环境(如离散状态和动作)的支持。框架的核心保持不变,只是简单地概括了与环境的接口。为了向后兼容,用户仍然可以下载 1.0 版本。


此外,新版本还包括两个经典控制环境的默认配置:CartPole 和 Acrobot;在这些环境中,用户可以在几分钟内训练 Dopamine 代理。与标准 Atari 2600 游戏的训练时间(标准 GPU 上大约 5 天)相比,这些环境允许研究人员在更大规模的 Atari 游戏上测试比之前更快地迭代研究思路。新版本还包括一个合作实验室,演示如何在 Cartpole 和 Acrobot 上训练代理。最后,GymPreprocessing 类为如何将 Dopamine 与其他自定义环境一起使用提供了示例。


拓展阅读


吊打OpenAI!谷歌重磅开源强化学习框架Dopamine


2019-02-09 09:004141
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 277.4 次阅读, 收获喜欢 1301 次。

关注

评论

发布
暂无评论
发现更多内容

云服务器挂载硬盘命令

百度搜索:蓝易云

云计算 Linux 运维 云服务器 硬盘

Centos7安装Node.js详细教程。

百度搜索:蓝易云

node.js 云计算 Linux centos 运维

Dify.AI:简单易用的 LLMOps 平台,可视化创造和运营你的 AI 原生应用

Dify

AI LLMOps

Golang微服框架Kratos与它的小伙伴系列 - ORM框架 - GORM

golang ORM gorm Kratos

如何实现高效的动态鉴权

KaiwuDB

KaiwuDB 动态鉴权

Coral Finance 将为 Zepoch 节点空投,Nautilus生态空投季开启

股市老人

从可逆计算看DSL的设计要点

canonical

低代码 dsl 低代码平台 领域特定语言 模型驱动

oracle已有表的分表分区优化操作步骤(单表过大)

zhengzai7

oracle 表分区

分布式事务两阶段提交和三阶段提交有什么区别?

王磊

java面试

Linux内核编译很简单,六步编译一个自己的内核

树上有只程序猿

Linux 编译

微信安全基于 Flink 实时特征开发平台实践

Apache Flink

大数据 flink 实时计算

Coral Finance 将为 Zepoch 节点空投,Nautilus生态空投季开启

威廉META

Cassandra SSTable 合并策略(一):STCS

冰心的小屋

Cassandra STCS Compaction

Spring AOP 中,切点有多少种定义方式?

江南一点雨

Java spring

Coral Finance 将为 Zepoch 节点空投,Nautilus生态空投季开启

鳄鱼视界

指标让 AI 更懂业务|Kyligence Copilot 是如何做到的?

Kyligence

Kyligence Copilot 数智助理

vhdns软件介绍与功能特性

新消费日报

Golang微服务框架kratos实现Socket.IO服务

golang socket websocket Kratos

Golang微服务框架kratos实现SignalR服务

golang SignalR Kratos

16款好用的白板笔记软件推荐,干货整理!

彭宏豪95

效率工具 软件推荐 科技 在线白板 Mac笔记软件

如何确定产品要做什么终端?

Bonaparte

产品 产品设计 产品终端

C++ 中的std::array实现编译器排序

梦笔生花

Golang微服框架Kratos与它的小伙伴系列 - ORM框架 - Ent

golang ORM Kratos

Golang微服务框架kratos实现SSE服务

golang websocket Kratos openai

Golang微服务框架Kratos实现GraphQL服务

golang graphql Kratos

低代码平台技术分享官丨系统集成系列之领域建模

inBuilder低代码平台

Docker学习路线12:开发者体验

小万哥

Java c++ Go Docker 运维

百度智能云连拿四年第一,为什么要深耕AI公有云市场

脑极体

AI 大模型

AntDB数据库与东方通TongWeb完成兼容互认,共筑数字化底座核心能力

亚信AntDB数据库

数据库 AntDB 企业号 7 月 PK 榜

热烈祝贺埃文科技荣获CCF第38届中国计算机应用大会计算机应用科学技术二等奖

郑州埃文科技

谷歌发布开源Dopamine 2.0,让强化学习变得更灵活_AI&大模型_谷歌博客_InfoQ精选文章