2025 AI基础设施风向标,不看必后悔!#AI基础设施峰会 了解详情
写点什么

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗

DeepMind 最新通用游戏 AI 智能体 SIMA 来了

  • 2024-03-20
    北京
  • 本文字数:3349 字

    阅读完需:约 11 分钟

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗

回想那些年,当 OpenAI Five 在 Dota 2 的战场上展现出超越人类的策略和协同,我们见证了 AI 在复杂游戏领域的惊人潜力。那时,围棋的神话已被 Alphago 刷新,但许多人仍将 AI 的成功视为特定领域的孤例。然而,历史正在翻篇。今天,DeepMind 带来了 SIMA——一种全新的通用游戏 AI 智能体,它不仅能够理解和执行自然语言指令,还能跨越多个 3D 虚拟世界自如行动。随着 SIMA 的问世,我们不禁要问:游戏的未来将被重新定义吗?


DeepMind 的通用游戏 AI 革命 -SIMA


DeepMind 最近公布了其在人工智能领域的一项重大进展:SIMA(Scalable Instructable Multiworld Agent),这是一种能够在多种 3D 虚拟环境中根据自然语言指令执行任务的通用 AI 智能体。DeepMind 与多家游戏开发商合作,在不同的电子游戏中训练了 SIMA,这标志着智能体首次能够广泛理解游戏世界,并能够像人类一样,根据自然语言指令执行虚拟环境中的任务。



DeepMind 表示,这项工作的目标不再仅仅是在游戏中获得高分。对于 AI 系统来说,学会玩电子游戏本身已经是一个技术壮举,但能够在多种游戏设置中遵循指令并理解环境设计的 AI 智能体则更具现实意义。


他们进一步解释说,这项研究展示了如何通过语言界面将高级 AI 模型的功能转化为具有实用性、能够匹配现实世界的操作。


为了让 SIMA 适应多种环境,DeepMind 与八家游戏工作室合作,在九款不同的电子游戏上训练并测试了 SIMA。这些游戏包括 Hello Games 的《无人深空》和 Tuxedo Labs 的《Teardown》。每款游戏都为 SIMA 提供了一个新的交互世界,包括从简单的导航和菜单使用到复杂的资源开采、飞船驾驶和头盔制作等一系列技能。


DeepMind 强调,SIMA 是一种 AI 智能体,能够感知并理解各种环境,然后采取行动以实现用户通过自然语言提出的目标。SIMA 包括一个为精确图像 - 语言映射而设计的模型,以及一个视频模型,用于预测屏幕上接下来可能发生的事件。


重要的是,SIMA 不需要访问游戏的源代码或特定 API,它仅需要两项输入:屏幕上的图像用户提供的简单自然语言指令


SIMA 会使用键盘和鼠标输出来控制游戏内的核心角色完成指令执行。由于这套简单的界面组合与人类使用场景相同,因此 SIMA 能够与任何虚拟环境进行交互。当前版本的 SIMA 已经接受了 600 项基本技能评估,涵盖导航(例如「左转」)、对象交互(「爬梯子」)、和菜单使用(「打开地图」)等操作。经过训练,SIMA 约在 10 秒内即可完成简单任务。


通过这项研究,DeepMind 展示了 SIMA 的跨游戏泛化能力,即在多种游戏环境中接受训练的 SIMA 智能体,其性能明显优于只在单一游戏中训练的智能体。研究证明,接受过多种游戏训练的智能体在质量上要远超单一游戏训练出的智能体。在 DeepMind 的评估中,SIMA 智能体在一组九款 3D 游戏上接受了训练,其表现明显优于仅在各单独游戏上进行训练的所有其他专用智能体。


更重要的是,平均来看在八款游戏上进行训练的智能体,在余下一款游戏中的表现同仅在该游戏上训练的智能体几乎水平相当。而这种在全新环境下发挥作用的能力,也凸显出 SIMA 超越其训练环境的强大泛化能力。


目前的初步结果令他们感到欣喜,但 SIMA 还需要更多研究才能在已接触过还尚未接触过的游戏中达到人类玩家的水平。


DeepMind 也谈到,SIMA 的表现依赖于语言指导。在控制测试中,智能体在不接受任何语言训练或指令引导时,就会出现漫无目的、原地打转的情况。同时他们也评估了 SIMA 依照指令完成近 1500 个游戏内不同任务的能力,其中部分任务有人类玩家的协助。


DeepMind 表示,SIMA 的成功展示了通过电子游戏作为测试平台,AI 技术如何帮助人类解决实际问题的巨大潜力。他们希望通过进一步的研究,使 SIMA 能够理解更复杂的指令并执行更多高级任务,最终实现更具通用性和实用性的 AI 系统。


总的来说来说,SIMA 就像是一个能够听懂人类指令并在多个视频游戏世界中执行这些指令的超级游戏玩家。这项研究展示了 AI 技术在理解和执行复杂任务方面的巨大潜力。


SIMA 的能力展示:重塑游戏 AI 的未来


从他们的介绍中,可以窥探,未来的 SIMA 一定会拥有以下“超能力了”。


首先它提高游戏 AI 的质量:通过使用类似 SIMA 的 AI 代理,游戏开发者可以创建出更加智能和适应性强的游戏 AI,这些 AI 能够更自然地与玩家互动,提供更具挑战性和多样性的游戏体验。这种 AI 能够根据自然语言指令执行复杂任务,可能会让游戏世界的 NPC(非玩家角色)行为更加真实和有趣。


其次,它能够加速游戏测试和开发:SIMA 展示了在多种游戏环境中遵循自然语言指令的能力,这意味着它可以被用作自动化测试工具,帮助开发者快速识别游戏中的问题或不足。自动化测试可以提高开发效率,减少重复性工作,使开发团队能够专注于创造性任务。


当然,SIMA 一定会促进游戏设计的创新:SIMA 的研究强调了 AI 和自然语言处理技术在游戏设计中的潜力。开发者可能会受到启发,探索新的游戏机制和故事叙述方法,其中玩家可以通过自然语言与游戏世界互动。这可能会开启全新的游戏类型,其中玩家与游戏世界的交互更加直观和富有沉浸感。


跨游戏学习和适应能力:SIMA 在多个游戏中的表现突出了 AI 的跨游戏学习能力,这对于开发多样化游戏内容的开发者来说是一个重要的里程碑。这种能力意味着 AI 可以在一个游戏中学到的技能和知识转移到另一个游戏中,为开发跨游戏平台或系列游戏提供了新的可能性。


社区反响:玩家和开发者对 SIMA Or Game 的看法


在 Hacker news 的评论区,大家就这个新闻表达了相当高的关注,许多人的焦点是在人工智能的能力、它们与人类玩家的比较,以及 AI 技术的进步是否被过度夸大等。



“我永远不会忘记在 Dota 2017 年的比赛上,OpenAI 展示了一个能够挑战职业 Dota 玩家的 AI。Dota 是一个极其复杂和困难的游戏。这对我来说是一个令人大开眼界的时刻”。- 译


有人分享了 OpenAI 在 Dota 游戏中对抗职业玩家并取得胜利的例子,这被视为 AI 技术的一个重要进展。然而,也有批评声音指出,这些成就并不意味着 AI 已经能够完全理解或在未见过的游戏中表现得像人类那样。


例如,在 Dota 的例子中,为了让 AI 能够参与比赛,游戏的范围被大幅缩减,AI 只需要理解 10 个英雄在两种特定的 5 人组合中的表现,而通常情况下,游戏中有 100 多个英雄可以以任何排列组合选择,某些游戏机制也被限制只对人类玩家使用,因为 AI 无法理解它们。这表明,尽管 AI 在某些受限环境中的表现令人印象深刻,但它们在泛化能力和处理完整游戏版本方面仍然存在巨大差距。



同时也有人持沮丧的观点,认为这对于大型多人在线角色扮演游戏(MMORPG)来说,无疑是一声丧钟。因为以后在这些游戏中都是机器人 AI。。



“我希望开发者能利用这项技术为 NPC 注入更多生命力。很多时候,我们被告知角色扮演游戏中的 NPC 将拥有自己的生活,独立于玩家做自己的事情等等,但这些承诺从未真正实现过任何值得注意的成果。然而,有了 AI 技术,我觉得我们可能正在接近这个目标。”-译


有的网友则表示非支持,SIMA 的出现或许可以给 NPC 赋予更多生命力的期待。然而,一些评论者对于这种技术进步是否真的能使游戏变得更有趣表示怀疑,担心过度追求 NPC 的真实性可能会导致不好的效应,或者增加游戏的摩擦,从而降低游戏体验的乐趣。尽管存在这样的担忧,也有人对未来持乐观态度,认为开发者将找到使用 AI 创造有趣游戏的方法。


从其他的讨论中还看到了,有些人觉得游戏并不需要过分追求现实主义才能变得更好,游戏是现实生活的一种简化或夸张,旨在提供良好的体验而非模仿现实。尽管存在挑战,但许多人相信,随着 AI 技术的进步,游戏开发者将能够创造出新类型的游戏,其中 NPC 的不可预测性和更复杂的行为将成为核心机制,从而为玩家提供全新的游戏体验。



还有些肯定者的评价,这位网友指出 SIMA 代理在接受了九款 3D 游戏集合的训练后,其表现显著超过了仅在单个游戏上训练的专门代理。更令人惊讶的是,即便是在未曾见过的游戏中,经过 N-1 游戏训练的代理也能达到与专门训练代理相近的水平。这一发现挑战了许多人的预期,即 AI 的成功往往被认为是因为训练集中包含了特定的数据,而忽视了算法本身的转移学习能力。


对于 SIMA 或者游戏未来,你有什么想说的?欢迎评论区留下你的建议。


参考链接:


https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/


https://news.ycombinator.com/item?id=39692387

2024-03-20 18:597403

评论

发布
暂无评论
发现更多内容

恒源云(GpuShare)_这个春天,GpuShare与你同行

恒源云

抗疫

MASA Blazor入门这一篇就够了

MASA技术团队

C# .net 组件 组件库

百度希壤元宇宙平台上线首个汽车数字展厅,领克探索汽车营销新方式

百度开发者中心

企业在线产品宣传册应该如何设计?

小炮

产品宣传手册

信通院推出数字化赋能者新标准天翼云获评数字化转型赋能服务集体

天翼云开发者社区

Docker Build时的安全问题

火线安全

Docker 云原生 云安全 docker build

跑马灯带你深入浅出TextView的源码世界

vivo互联网技术

android 源码分析 TextView

融云互联网通信安全揭秘之链路安全

融云 RongCloud

网络安全

雄安新区设立四周年,看天翼云以数字底座托起未来之城

天翼云开发者社区

天翼云成为首个加入openGauss社区的运营商云

天翼云开发者社区

以太坊的扩容革命:ETH2.0

不登山的小鲁

以太坊 扩容 Ethereum eth eth2.0

译文《Java并发编程之volatile》

潘大壮

并发编程 volatile 后端 Java EE

安全Linux 内核提权漏洞分析

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

墨天轮访谈 | Pika数据库陈磊:云时代下,键值数据库是否会被替代?

墨天轮

数据库 KV存储引擎 国产数据库

OpenHarmony 3.1 Beta版本关键特性解析——探秘隐式查询

OpenHarmony开发者

OpenHarmony 隐式查询

限量独家!濒危动物数字藏品免费发放!

百度开发者中心

Gartner发布中国IaaS PaaS市场服务报告,天翼云强势入选

天翼云开发者社区

Rust 用于移动开发的几种方式

非凸科技

Java c++ Python rust 量化

一文来了解关于分布式锁的那些事儿

Linux服务器开发

redis 分布式 分布式锁 Linux服务器开发 Linux后台开发

中台和多云管理是伪问题?运维要集体下岗了吗?

火线安全

DevOps 云原生 云安全

QoS 设计:车联网平台消息传输质量保障|车联网平台搭建从入门到精通 04

EMQ映云科技

物联网 IoT mqtt coap emq

公有云市场百舸争流!天翼云稳居第一梯队,进入领导者象限

天翼云开发者社区

2022年最热门的招聘技术技能是什么,您绝对想不到

禅道项目管理

项目管理 开发技能

长连接网关技术专题(七):小米小爱单机120万长连接接入层的架构演进

JackJiang

网络编程 websocket 即时通讯 网关 长连接

Linux云计算之linux grep命令详解

学神来啦

云计算 Linux 运维 grep

开学季 | 飞桨AI Studio课程学习,小白也可以成为一名优秀的算法工程师!

百度开发者中心

DevOps落地思考

火线安全

DevOps 云原生 云安全 DevOps认证

春分耕种时,AI“现身”田间地头

百度开发者中心

内存之旅——如何提升CMA利用率?

OpenHarmony开发者

内存 OpenHarmony

VuePress 博客之 SEO 优化(六)站长工具

冴羽

Vue 前端 vuepress SEO 博客搭建

融云直播 SDK 升级,让直播「PK」起来

融云 RongCloud

直播 IM 场景化

DeepMind 最新通用游戏 AI 智能体 SIMA 来了,游戏的未来会被重新定义吗_AI&大模型_李忠良_InfoQ精选文章