写点什么

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗

DeepMind 最新通用游戏 AI 智能体 SIMA 来了

  • 2024-03-20
    北京
  • 本文字数:3349 字

    阅读完需:约 11 分钟

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗

回想那些年,当 OpenAI Five 在 Dota 2 的战场上展现出超越人类的策略和协同,我们见证了 AI 在复杂游戏领域的惊人潜力。那时,围棋的神话已被 Alphago 刷新,但许多人仍将 AI 的成功视为特定领域的孤例。然而,历史正在翻篇。今天,DeepMind 带来了 SIMA——一种全新的通用游戏 AI 智能体,它不仅能够理解和执行自然语言指令,还能跨越多个 3D 虚拟世界自如行动。随着 SIMA 的问世,我们不禁要问:游戏的未来将被重新定义吗?


DeepMind 的通用游戏 AI 革命 -SIMA


DeepMind 最近公布了其在人工智能领域的一项重大进展:SIMA(Scalable Instructable Multiworld Agent),这是一种能够在多种 3D 虚拟环境中根据自然语言指令执行任务的通用 AI 智能体。DeepMind 与多家游戏开发商合作,在不同的电子游戏中训练了 SIMA,这标志着智能体首次能够广泛理解游戏世界,并能够像人类一样,根据自然语言指令执行虚拟环境中的任务。



DeepMind 表示,这项工作的目标不再仅仅是在游戏中获得高分。对于 AI 系统来说,学会玩电子游戏本身已经是一个技术壮举,但能够在多种游戏设置中遵循指令并理解环境设计的 AI 智能体则更具现实意义。


他们进一步解释说,这项研究展示了如何通过语言界面将高级 AI 模型的功能转化为具有实用性、能够匹配现实世界的操作。


为了让 SIMA 适应多种环境,DeepMind 与八家游戏工作室合作,在九款不同的电子游戏上训练并测试了 SIMA。这些游戏包括 Hello Games 的《无人深空》和 Tuxedo Labs 的《Teardown》。每款游戏都为 SIMA 提供了一个新的交互世界,包括从简单的导航和菜单使用到复杂的资源开采、飞船驾驶和头盔制作等一系列技能。


DeepMind 强调,SIMA 是一种 AI 智能体,能够感知并理解各种环境,然后采取行动以实现用户通过自然语言提出的目标。SIMA 包括一个为精确图像 - 语言映射而设计的模型,以及一个视频模型,用于预测屏幕上接下来可能发生的事件。


重要的是,SIMA 不需要访问游戏的源代码或特定 API,它仅需要两项输入:屏幕上的图像用户提供的简单自然语言指令


SIMA 会使用键盘和鼠标输出来控制游戏内的核心角色完成指令执行。由于这套简单的界面组合与人类使用场景相同,因此 SIMA 能够与任何虚拟环境进行交互。当前版本的 SIMA 已经接受了 600 项基本技能评估,涵盖导航(例如「左转」)、对象交互(「爬梯子」)、和菜单使用(「打开地图」)等操作。经过训练,SIMA 约在 10 秒内即可完成简单任务。


通过这项研究,DeepMind 展示了 SIMA 的跨游戏泛化能力,即在多种游戏环境中接受训练的 SIMA 智能体,其性能明显优于只在单一游戏中训练的智能体。研究证明,接受过多种游戏训练的智能体在质量上要远超单一游戏训练出的智能体。在 DeepMind 的评估中,SIMA 智能体在一组九款 3D 游戏上接受了训练,其表现明显优于仅在各单独游戏上进行训练的所有其他专用智能体。


更重要的是,平均来看在八款游戏上进行训练的智能体,在余下一款游戏中的表现同仅在该游戏上训练的智能体几乎水平相当。而这种在全新环境下发挥作用的能力,也凸显出 SIMA 超越其训练环境的强大泛化能力。


目前的初步结果令他们感到欣喜,但 SIMA 还需要更多研究才能在已接触过还尚未接触过的游戏中达到人类玩家的水平。


DeepMind 也谈到,SIMA 的表现依赖于语言指导。在控制测试中,智能体在不接受任何语言训练或指令引导时,就会出现漫无目的、原地打转的情况。同时他们也评估了 SIMA 依照指令完成近 1500 个游戏内不同任务的能力,其中部分任务有人类玩家的协助。


DeepMind 表示,SIMA 的成功展示了通过电子游戏作为测试平台,AI 技术如何帮助人类解决实际问题的巨大潜力。他们希望通过进一步的研究,使 SIMA 能够理解更复杂的指令并执行更多高级任务,最终实现更具通用性和实用性的 AI 系统。


总的来说来说,SIMA 就像是一个能够听懂人类指令并在多个视频游戏世界中执行这些指令的超级游戏玩家。这项研究展示了 AI 技术在理解和执行复杂任务方面的巨大潜力。


SIMA 的能力展示:重塑游戏 AI 的未来


从他们的介绍中,可以窥探,未来的 SIMA 一定会拥有以下“超能力了”。


首先它提高游戏 AI 的质量:通过使用类似 SIMA 的 AI 代理,游戏开发者可以创建出更加智能和适应性强的游戏 AI,这些 AI 能够更自然地与玩家互动,提供更具挑战性和多样性的游戏体验。这种 AI 能够根据自然语言指令执行复杂任务,可能会让游戏世界的 NPC(非玩家角色)行为更加真实和有趣。


其次,它能够加速游戏测试和开发:SIMA 展示了在多种游戏环境中遵循自然语言指令的能力,这意味着它可以被用作自动化测试工具,帮助开发者快速识别游戏中的问题或不足。自动化测试可以提高开发效率,减少重复性工作,使开发团队能够专注于创造性任务。


当然,SIMA 一定会促进游戏设计的创新:SIMA 的研究强调了 AI 和自然语言处理技术在游戏设计中的潜力。开发者可能会受到启发,探索新的游戏机制和故事叙述方法,其中玩家可以通过自然语言与游戏世界互动。这可能会开启全新的游戏类型,其中玩家与游戏世界的交互更加直观和富有沉浸感。


跨游戏学习和适应能力:SIMA 在多个游戏中的表现突出了 AI 的跨游戏学习能力,这对于开发多样化游戏内容的开发者来说是一个重要的里程碑。这种能力意味着 AI 可以在一个游戏中学到的技能和知识转移到另一个游戏中,为开发跨游戏平台或系列游戏提供了新的可能性。


社区反响:玩家和开发者对 SIMA Or Game 的看法


在 Hacker news 的评论区,大家就这个新闻表达了相当高的关注,许多人的焦点是在人工智能的能力、它们与人类玩家的比较,以及 AI 技术的进步是否被过度夸大等。



“我永远不会忘记在 Dota 2017 年的比赛上,OpenAI 展示了一个能够挑战职业 Dota 玩家的 AI。Dota 是一个极其复杂和困难的游戏。这对我来说是一个令人大开眼界的时刻”。- 译


有人分享了 OpenAI 在 Dota 游戏中对抗职业玩家并取得胜利的例子,这被视为 AI 技术的一个重要进展。然而,也有批评声音指出,这些成就并不意味着 AI 已经能够完全理解或在未见过的游戏中表现得像人类那样。


例如,在 Dota 的例子中,为了让 AI 能够参与比赛,游戏的范围被大幅缩减,AI 只需要理解 10 个英雄在两种特定的 5 人组合中的表现,而通常情况下,游戏中有 100 多个英雄可以以任何排列组合选择,某些游戏机制也被限制只对人类玩家使用,因为 AI 无法理解它们。这表明,尽管 AI 在某些受限环境中的表现令人印象深刻,但它们在泛化能力和处理完整游戏版本方面仍然存在巨大差距。



同时也有人持沮丧的观点,认为这对于大型多人在线角色扮演游戏(MMORPG)来说,无疑是一声丧钟。因为以后在这些游戏中都是机器人 AI。。



“我希望开发者能利用这项技术为 NPC 注入更多生命力。很多时候,我们被告知角色扮演游戏中的 NPC 将拥有自己的生活,独立于玩家做自己的事情等等,但这些承诺从未真正实现过任何值得注意的成果。然而,有了 AI 技术,我觉得我们可能正在接近这个目标。”-译


有的网友则表示非支持,SIMA 的出现或许可以给 NPC 赋予更多生命力的期待。然而,一些评论者对于这种技术进步是否真的能使游戏变得更有趣表示怀疑,担心过度追求 NPC 的真实性可能会导致不好的效应,或者增加游戏的摩擦,从而降低游戏体验的乐趣。尽管存在这样的担忧,也有人对未来持乐观态度,认为开发者将找到使用 AI 创造有趣游戏的方法。


从其他的讨论中还看到了,有些人觉得游戏并不需要过分追求现实主义才能变得更好,游戏是现实生活的一种简化或夸张,旨在提供良好的体验而非模仿现实。尽管存在挑战,但许多人相信,随着 AI 技术的进步,游戏开发者将能够创造出新类型的游戏,其中 NPC 的不可预测性和更复杂的行为将成为核心机制,从而为玩家提供全新的游戏体验。



还有些肯定者的评价,这位网友指出 SIMA 代理在接受了九款 3D 游戏集合的训练后,其表现显著超过了仅在单个游戏上训练的专门代理。更令人惊讶的是,即便是在未曾见过的游戏中,经过 N-1 游戏训练的代理也能达到与专门训练代理相近的水平。这一发现挑战了许多人的预期,即 AI 的成功往往被认为是因为训练集中包含了特定的数据,而忽视了算法本身的转移学习能力。


对于 SIMA 或者游戏未来,你有什么想说的?欢迎评论区留下你的建议。


参考链接:


https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/


https://news.ycombinator.com/item?id=39692387

2024-03-20 18:597195

评论

发布
暂无评论
发现更多内容

南开大学OpenHarmony技术俱乐部揭牌成立

科技热闻

移动App开发常见的三种模式(原生应用、H5移动应用、混合模式应用)

天津汇柏科技有限公司

软件开发 APP开发 软件定制开发

游戏行业需要堡垒机吗?用哪款堡垒机好?

行云管家

网络安全 游戏 数据安全 堡垒机

跨境电商三大趋势

api开发

再聊对架构决策记录的一些思考

京东科技开发者

CCE集群VPC网络模式下几种访问场景

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟

为了跳槽或提升自己,你会先学习哪一门编程语言?

小齐写代码

借助 Terraform 功能协调部署 CI/CD 流水线-Part 2

SEAL安全

运维 云原生 CI/CD Terraform

组团上车游百度,爱采购财富游学团助推中小企业开年抢跑!

科技热闻

震惊:苹果手机电池栏“黑白无常”

京东科技开发者

IPQ9574/WiFi 7: Connecting everything, opening a new chapter in smart life

wallysSK

简单了解不同行业下4a的定义

行云管家

网络安全

Amazon SageMaker 机器学习之旅的助推器

亚马逊云科技 (Amazon Web Services)

GaussDB(DWS)集群通信:详解pooler连接池

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 华为云GaussDB(DWS)

开源无代码 / 低代码平台 NocoBase 0.20:支持多数据源

NocoBase

开源 低代码 低代码开发 低代码平台 无代码平台

数据指标体系搭建方法及经验

ClkLog

PostgreSQL数据库连接数设置的越大越好吗

张文平

数据库 postgresql 连接数 数据库配置

掌握提示词工程与大模型多场景实战

百度开发者中心

人工智能 自动驾驶 大模型 Prompt

探索大模型提示词

百度开发者中心

人工智能 自然语言处理 图像识别 大模型

浅谈代码架构

比伦

ios 架构

目前人工智能的发展,未来对人类的就业有那些影响?

算法的秘密

MySQL 8.0.26版本升级32版本查询数据为空的跟踪

GreatSQL

华为云亮相LEAP科技展,携手沙特共创智能新高度

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟

京东API赋能电商生态,商品详情随时掌握

技术冰糖葫芦

API 接口 API 文档 API 策略

探索AI的边界:如何精准地测试人工智能

测试人

软件测试 测试开发

利用1688商品详情API:打造高效的电商解决方案

技术冰糖葫芦

API Explorer API 接口 API 策略 pinduoduo API

HarmonyOS-安装篇(DevEco Studio)

京东科技开发者

大模型训练中的Prompt Learning

百度开发者中心

人工智能 自然语言处理 大模型

探索AI的边界:如何精准地测试人工智能

霍格沃兹测试开发学社

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗_AI&大模型_李忠良_InfoQ精选文章