HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

OpenAI 又赢麻了!谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4,OpenAI 的挖人大计就出炉了

  • 2023-06-29
    北京
  • 本文字数:3164 字

    阅读完需:约 10 分钟

OpenAI 又赢麻了!谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4,OpenAI 的挖人大计就出炉了

谷歌在上个月的开发者大会上公布了一系列 AI 新项目,当时首次亮相的 Gemini 曾受到不少嘲讽。但近日,DeepMind 联合创始人兼 CEO Demis Hassabis 自曝,工程师们正在使用 AlphaGo 的技术来开发 Gemini,其强大程度有望超越 OpenAI 的当家花旦 ChatGPT。

 

在 AlphaGo 的加持下,Gemini 瞬间备受关注。在 2016 年,谷歌 DeepMind 人工智能实验室打造的 AlphaGo 程序成功击败围棋世界冠军,写下了 AI 发展史上的一页新篇章。

 

仍在开发当中的 DeepMind Gemini 是一套专门处理文本的大语言模型,其本质与 ChatGPT 家族的 GPT-4 相似。根据此前的介绍,Gemini 一开始就以多模式、高效的工具和 API 集成为目标而创建,旨在支持未来的创新,例如内存和规划。经过微调和严格的安全测试后,Gemini 将提供各种尺寸和功能。

 

现在,Hassabis 表示,他的团队将 GPT 技术与 AlphaGo 的特性加以结合,希望赋予系统规划和解决问题的新能力。“从宏观来讲,大家可以把 Gemini 理解为结合了 AlphaGo 系统优势与大模型令人惊叹的语言能力。我们还做出了其他非常有趣的创新。”

 

之前谷歌开发者大会上,谷歌 CEO Sundar Pichai 也说道,“虽然还为时过早,但我们已经看到了之前型号中未曾见过的、令人印象深刻的多模式功能。”

 

DeepMind:下一代大模型碾压 GPT-4

 

要训练出 OpenAI GPT-4 这样的大语言模型,研究人员需要将书籍、网页和其他来源处的大量精选文本输入到 Transformer 机器学习软件当中。模型会利用训练数据中表现出的模式,熟练预测一段文本之后应该出现的一个个字母和单词。这种简单的文本预测机制在回答问题、生成自然语言/代码方面被证明拥有强大的潜力空间。

 

要进一步开发 ChatGPT 及类似功能的语言模型,DeepMind 认为还有另一个重要的附加步骤,就是使用基于人类对 AI 模型答案做出的反馈,进而借助强化学习提高其性能。DeepMind 在强化学习方面的丰富经验,也许能让研究人员为 Gemini 赋予更多新颖能力。

 

AlphaGo 基于 DeepMind 首创的强化学习技术。这项技术要求 AI 模型在问题之上反复尝试并接收关于性能的反馈,据此设计接下来将要采取的行动(例如围棋或电子游戏),从而让软件一步步学会解决棘手问题。它还采用所谓“树搜索”方法,以探索并记住棋盘上可能采取的各种动作。如果这一思路能够帮助语言模型迎来下一次重大飞跃,则新 AI 或能在互联网和计算机上执行更多种类的任务。

 

Hassabis 和他的团队也许还会利用 AI 领域的其他思路继续增强大语言模型。DeepMind 研究人员的关注领域涵盖机器人、神经科学等诸多方向。本周早些时候,该公司展示了一种算法,能够学习借助不同类型的机械手臂完成操作任务。

 

人们普遍认为,跟人类和其他动物一样,AI 的能力提升也需要从现实世界中学习客观经验。一部分 AI 专家相信,语言模型的最大限制就是只能通过文本以间接方式了解世界。

 

Hassabis 坦言,Gemini 目前仍在开发当中,且整个过程需要几个月时间,成本则在数千万到数亿美元之间。OpenAI 公司 CEO Sam Altman 曾有 4 月表示,GPT-4 的开发成本超过了 1 亿美元。

 

Hassabis 的任务就是加快谷歌的 AI 开发进度,同时管理种种未知的潜在风险。最近一段时间,语言模型的快速进步已经令 AI 专家(包括部分算法专家)感到担忧,害怕这项技术被恶意滥用或者变得难以控制。某些内部技术人士甚至呼吁暂停开发更强大的算法,避免匆忙之中造成重大威胁。

 

Hassabis 认为,AI 技术的确拥有巨大的潜在助益,例如在健康或气候等领域推动科学发现,所以人类探索 AI 的脚步绝不能停止。但他也强调,强制叫停研究明显脱离实际,基本没有可行性。“只要处置得当,AI 将成为有史以来对人类最有益的技术成果。我们必须有勇气去追求这样的关键成果。”

 

这也不是说 Hassabis 在一味强调快速开发 AI 技术。DeepMind 早在 ChatGPT 出现之前,就一直在探索 AI 可能带来的各种风险。该公司联合创始人之一 Shane Legg 多年来一直领导一支内部“AI 安全”小组。Hassabis 上个月与其他备受瞩目的 AI 领袖一道签署了一份声明,警告称 AI 也许有一天会引发与核战争或全球流行病相当的严峻风险。

 

Hassabis 强调,目前最大的挑战之一就是确定更强的 AI 具体会带来哪些风险。他解释道,“我认为 AI 领域需要在评估测试等方面开展更多研究——这已经是一项非常紧迫的任务”,用以确定新 AI 模型的能力和可控性。为此,DeepMind 可能会逐步向外部科学家开放自己的系统。“希望学术界能够尽早接触到这些前沿模型。”如果此观点得到落实,也许有助于解决科技巨头以外的 AI 专家被排除在最新研究之外的担忧。

 

那我们究竟要不要为 AI 大爆发这样一个未来而担忧?Hassabis 安慰道,其实没人真能确定 AI 会不会成为一种重大威胁。但他相信,如果 AI 研究继续以目前的速度推进,那业界确实没什么时间制定相应的保障措施。“我能切身观察到我们在构建 Gemini 时的一步步进展,相信这些成果都将发挥预期当中的作用。”

 

OpenAI:入驻 DeepMind 大本营

 

自从 ChatGPT 去年惊艳亮相以来,谷歌很快推出了自己的聊天机器人 Bard,并将生成式 AI 技术应用至搜索引擎及其他众多产品当中。为了增强 AI 研究力度,谷歌公司还于 4 月将 Hassabis 领导的 DeepMind 部门与谷歌另一 AI 实验室 Brain 合并,建立起一个新的谷歌 DeepMind。Hassabis 表示,新团队将汇聚双方最近一段时间为奠定 AI 基础所积蓄的强大力量。“纵观我们在 AI 领域的进展,就会发现 80%到 90%的成果都来自这两支队伍。过去十年间,双方也都取得过辉煌的成就。”

 

Hassabis 本人曾经凭借 AlphaGo 掀起过一波 AI 热潮。所以面对如今这轮技术巨头争相投入的 AI 淘金之风,他显得颇有经验。但另一方面,其竞争对手 OpenAI 的扩张脚步也在继续。

 

几乎在同一时间,OpenAI 宣布,将在伦敦开设其第一个国际办事处。OpenAI 首席执行官 Sam Altman 表示,当 OpenAI 伦敦办事处将专注于提升“研究和工程能力”,同时平衡与“当地社区和政策制定者”的合作。

 

值得注意的是,伦敦是谷歌最大的人工智能研究部门 DeepMind 的长期总部基地。鉴于伦敦拥有著名的大学和丰富的学术历史,伦敦也是数据科学人才的源泉。OpenAI 这次海外扩张,将与谷歌在同一个城市近距离竞技。

 

自 2015 年成立以来,OpenAI 一直没有扩展到旧金山总部以外的地方。Altman 在一份声明中表示,这次扩张是一次吸引世界级人才的机会。据报道,Altman 也提出将波兰和法国作为该办事处的替代选择。其中,法国也被视为人工智能领域的领导者,谷歌Meta 都在巴黎设立了人工智能实验室

 

此时,正值 OpenAI 致力于创造利润之际。运行人工智能基础设施并不便宜,半导体研究公司 Semianalysis 层估计OpenAI 每天的成本约为 700,000 美元。考虑到这一点,英国的企业税比美国和其他欧洲国家低。

 

广义上讲,伦敦也正在成为人工智能初创企业蓬勃发展的中心。根据最近的一份报告,截至 2021 年,伦敦有超过 1,300 家人工智能公司,就风投资金而言,伦敦也是英国资金最多的城市。

 

对于 OpenAI 等大量投资人工智能的科技公司来说,伦敦也有很重要的政治地位,这些公司试图说服英国管理机构对人工智能进行宽松的监管。

 

在最近的一次游说之旅中,Altman 出现在伦敦大学学院,并呼吁“平衡”监管。Altman 威胁称,如果公司无法满足欧盟目前正准备出台的新人工智能(AI)立法规定,OpenAI 可能会“停止在欧盟的运营”。据悉,该法案是人工智能行业第一套综合法规之一。后来,Altman收回了这些评论。

 

有趣的是,DeepMind 创始人中的 Demis Hassabis 和 ShaneLegg 就是相识于伦敦大学学院生命科学系的盖茨比计算神经科学小组。

 

如今,OpenAI 在伦敦的办事处正在大量招聘,涉及各类研发、政策安全等岗位,是否会引发人才流动还未可知。但可以预见,OpenAI 与 谷歌 DeepMind 之间的竞争将会愈发激烈。

 

参考链接:

https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/

https://techcrunch.com/2023/06/28/openai-brings-the-competition-to-deepminds-doorstep-with-new-london-office/

2023-06-29 14:168011

评论

发布
暂无评论
发现更多内容

阿里P8亲测能实战落地的SpringCloud开发笔记已开源

996小迁

Java 程序员 架构 面试 SpringCloud

《程序员修炼之道》- 务实的哲学(1)

石云升

程序员 28天写作

应对新冠病毒传播-粤政协委员建议构建公共卫生区块链平台

CECBC

区块链 公共卫生

产品经理训练营第 0 期 第二次作业

孙行者

第0期 产品经理训练营

Vue.js笔试题解决业务中常见问题

我是哪吒

程序员 面试 Vue 大前端

常见运维监控系统的技术选型

OpsMind

运维 监控系统

用APICloud开发iOS App Clip(苹果小程序)详细教程

YonBuilder低代码开发平台

小程序云开发 大前端 移动开发 APP开发

极客时间产品训练营第二周作业

云随心

产品 第二周作业 产品训练营

红河州加速区块链等新技术与实体经济的深度融合

CECBC

数字经济

极客时间产品训练营第二周总结

云随心

产品 总结 产品训练营

Postgreshub中文资源网介绍

PostgreSQLChina

数据库 postgresql 开源 软件 开源社区

测试一下

TJJ

品牌升级后,TBase更名为TDSQL和TDSQL-A,CynosDB更名为TDSQL-C

数据君

Flink SQL 在字节跳动的优化与实践

Apache Flink

flink

搞定万亿级MySQL海量存储的索引与分表设计实战

Java架构师迁哥

腾讯云数据库品牌升级,大咖解读数据库三大变化

数据君

高承实:区块链是一个技术结构组织 而不是技术

CECBC

大数据

十年磨一剑,腾讯云数据库品牌重磅升级, “企业级分布式数据库TDSQL”来了!

数据君

七大步骤、备战60天,4面拿下字节跳动offer:时间规划+知识点+画脑图+做笔记+看书+看视频+刷题刷题

Java 程序员 面试

从根上理解高性能、高并发(六):通俗易懂,高性能服务器到底是如何实现的

JackJiang

网络编程 高并发 高性能 即时通讯

挑战前端知识点HTTP/ECMAScript

我是哪吒

大前端 HTTP ES6

产品思维和产品意识

ALone

目标岗位差异化对比

Geek_6a8931

架构师训练营第九周作业

zamkai

PostgreSQL中Oid和Relfilenode的映射

PostgreSQLChina

数据库 postgresql 开源 软件

Java程序员福音!阿里最新产物分布式小册:存储+计算+通信+资源调度

Java架构追梦

Java 阿里巴巴 架构 面试 分布式

别让假“努力”毁掉了你!面试了10家企业软件测试岗位,面试题整理

程序员阿沐

程序员 面试 软件测试 自动化测试 测试工程师

图解 | 原来这就是TCP

程序员 网络协议 架构师

【面试必备】Swift 面试题及其答案

ios swift

深圳程序员自谋生路的2020

鸠摩智首席音效师

开源 程序员 在线教育 创业者 深圳

LeetCode题解:389. 找不同,ASCII码求和,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

OpenAI 又赢麻了!谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4,OpenAI 的挖人大计就出炉了_Google_褚杏娟_InfoQ精选文章