强化学习是一种机器学习模式,适合允许“代理”以试错方式在交互式环境中行动的情况,代理可以利用来自这些行动的反馈逐步学习,以达到预定目标或最大限度提升某些类型的分数或反馈。这与监督式学习等其他形式的机器学习形成对比,监督式学习使用一组事实(基础事实)来训练模型,以便它可以进行推理。
我们希望您能在 AWS re:Invent 大会上获得强化学习方面的一些实际动手体验,今天我也会为您详细介绍这一模式。硬件和软件的组合可以使事物(字面意义)运转!
AWS DeepRacer
我们首先谈谈硬件和软件。AWS DeepRacer 是一款 1/18 比例的无线电控制四轮驱动车:
它搭载 Intel Atom® 处理器、四百万像素、1080p 分辨率摄像头、高速 (802.11ac) WiFi、多个 USB 端口和足以续航大约 2 小时的电池。Atom 处理器运行 Ubuntu 16.04 LTS、ROS(机器人操作系统)和 Intel OpenVino™ 计算机视觉工具套件。
AWS DeepRacer 包含经全面配置的云环境,可供您用于训练强化学习模型。它利用 Amazon SageMaker 中的全新强化学习功能,还包含由 AWS RoboMaker 提供支持的 3D 模拟环境。您可以针对模拟器中包含的预定义赛道集合训练自动驾驶模型,然后进行虚拟评估或将其下载到 AWS DeepRacer 汽车并在现实世界中验证其性能。
强化学习是用于实现自动驾驶汽车的技术之一;AWS DeepRacer 这一完美的汽车(可以这么说)能让您亲身体验并了解所有相关信息。我们正在加快批量生产,不久之后您就可以下单购买了。
您可以立即访问 aws.amazon.com/deepracer 预订自己的 AWS DeepRacer,并注册预览版。
re:Invent 上的 AWS DeepRacer 和强化学习
我的同事创建了一个令人难以置信的程序,可以帮助您开始使用 AWS DeepRacer 和强化学习!
re:Invent 参与者可以参加一场研讨会,在会上了解强化学习的基础知识,然后观看演示,了解如何创建、训练和调整 AWS DeepRacer 的自动驾驶模型。您将在在线模拟器中创建、训练和优化模型,然后将其加载到真正的 AWS DeepRacer 中,以便在我们的一条测试赛道上进行测试。您的目标:尽可能准确、快速地让 AWS DeepRacer 驶上赛道。我们每个小时都会举办一次比赛,参与者有机会赢取 AWS DeepRacer 和 AWS 积分。
发动引擎
如果您参加了 re:Invent 大会,不妨设想自己已经收到了发车命令,因为在接下来的 24 小时内,我们将在 AWS DeepRacer 研讨会上组建起第一支 AWS DeepRacer 车队,并驶上 MGM 赛道。在学习强化学习的过程中,您将使用 Amazon SageMaker、AWS RoboMaker 和其他 AWS 服务。共有 6 条主赛道(每条赛道上设有一个维修站)、1 个改装站、2 条额外的赛道(可供您用于训练和实验),此外还有一位帮您加快速度的 DJ。
今天(11 月 28 日)上午 11:30 到晚上 10 点,所有圈速都会进入 Speedway Leaderboard 排行榜。在当日比赛中速度最快的前三位开发人员将晋级 2018 年总决赛,争夺 AWS DeepRacer 2018 冠军。
决赛将于周四上午 8 点在 AWS re:Invent 国际赛道上举办,就在 Werner 发表主题演讲之前。届时您将有机会参加比赛、学习、赢取奖品,收集各种赠品!
AWS DeepRacer 车队
我们希望确保全世界的开发人员都有机会出席 re:Invent 大会,参与 AWS DeepRacer。为此,我万分激动地宣布,AWS DeepRacer 车队(首个覆盖全球范围的自动驾驶赛车车队)面向所有人开放。在 2019 年于世界各地举办的 AWS 全球峰会上,我们将举办一系列现场赛事,此外还会在全年当中举办多场虚拟活动和锦标赛。获奖者和得分最高者将晋级 re:invent 2019 大会上举办的 AWS DeepRacer 2019 冠军杯。我会在不久之后向大家介绍更多细节,您也可以访问 AWS DeepRacer 网站了解最新动向。
我很快就会发布更多详细信息,敬请关注,祝您在赛车活动中玩得开心!
作者介绍:
Jeff Barr
AWS 首席布道师; 2004 年开始发布博客,此后便笔耕不辍。
本文转载自 AWS 技术博客。
原文链接:
评论