写点什么

2016 年:DeepMind 给人类带来了什么?

  • 2016-12-25
  • 本文字数:3261 字

    阅读完需:约 11 分钟

自从 DeepMind 以 4:1 战胜围棋世界顶尖选手李世石之后,就声名鹊起,经常登上各大媒体的头条。从那以后,人工智能开始成为人们经常谈起的话题。

DeepMind 是一家位于英国的尖端科技公司,曾让 Facebook、Google 等巨头争相抢夺,最后 Google 在 2014 年 1 月以 4 亿英镑(6.66 亿美元)击败 Facebook 成功收购了 DeepMind。Google 已经在机器学习和 AI 领域处于前沿地位,那为什么还要不惜代价斥巨资来收购 DeepMind 呢?究竟 DeepMind 能为 Google 带来怎样的价值呢?

2015 年 10 月之前,Google 庞大的广告收入开始投入到 DeepMind 及众多类似的项目中去,然而这些项目谷歌花费时间及精力,却没有任何收入。后来,Google 如召唤神龙一般成立了母公司 Alphabet,自身反而成为这家 Alphabet 公司旗下唯一盈利的子公司。其他业务的经营收入从 Google 的资产负载表上拆分,Alphabet 其他业务的经营状况将会受到更加严格的审查,再也无法依赖 Google 这棵大树的庇荫了。

此次变动之后,DeepMind 在新架构中仍隶属于 Google。但它的价值远超过自身利润。

对 Google 和 Alphabet 而言,DeepMind 为公司在人工智能军备竞赛中占据了先机,有助于吸纳 AI 人才。来自牛津大学、伦敦大学、剑桥大学、斯坦福大学等人才纷纷选择了 Google,而非 Facebook、Microsoft 和 Amazon。其办公室目前已有 400 多名计算机和神经系统科学家,其中约四分之三在研究部门工作,其余的在应用部门,后者致力于构建基于人工智能的显示产品和服务。据悉他们计划未来扩大到 1000 人,除了在海外设立研发机构外,还招聘了一系列的人工智能专家,计划组建“人工智能安全团队”,旨在降低人工智能可能带给人类灾难的风险。

2010 年,Demise Hassabis 同 Mustafa Suleyman、Shane Legg 共同创立了 DeepMind 公司。DeepMind 的格局并不限于招募人才和曝光次数。其 CEO 与联合创始人 Demis Hassabis 将 DeepMind 描述为一种新形式的研究机构,结合了学术界的长远视角和“科技初创企业的专注和活力”。

Hassabis 表示,DeepMind 的目标是攻克“人工智能”的课题。这就促使公司需要研发多功能的“通用”人工智能,能够像人类一样进行广泛和高效思考。被 Google 收购之后,DeepMind 受益于 Google 强大的计算资源和雄厚的财力,如果让小公司收购的话,很可能会被要求尽快盈利,这样 Hassabis 会被种种繁琐事物打扰,而无法专注于研究。DeepMind 办公地点同过去一样仍旧设在伦敦,与硅谷山景城 Google 所在地保持安全距离,这样得以让 DeepMind 拥有更多的独立性。

如果 Hassabis 将来有一天真的研制出通用人工智能,对 Alphabet 而言将是一个巨大的成就。因为,这意味着创造了可无限被复制的数字化员工,并用于解决各种问题。不过,据了解,DeepMind 并非一家以商业模式运作的公司,其研发周期非常长,Hassabis 表示公司规划了长达 20 年的蓝图规划。他声称,从人类大脑获取灵感的思路,让 DeepMind 远超其他专注于机器学习,尤其是“深度学习”的研究机构。

即使 DeepMind 无法成功研制出等同或超越人类水平的人工智能,它开发的机器学习软件仍然可以为 Alphabet 做出很大的贡献。

今年 7 月份,Google 宣布,DeepMind 研发的学习软件已经成功让 Google 数据中心的能耗减少了约五分之二。该软件是通过学习数据中心的操作日志进行压缩,并不断地进行模拟操作,最终实现了过程的优化。

DeepMind 也在尝试利用现有的 AI 成果为公司创收。Suleyman 表示,DeepMind 的某些研发进展可用于管理能源基础设施、改善医疗系统、提供清洁水源等领域,这些都是他们盈利的潜在目标。

今年 11 月,DeepMind 与 NHS 旗下的基金会 Royal Free London 签订了为期五年的合同,任务是处理 172 万患者的医疗记录。今年早些时候,它获得了来自其他伦敦医院的两个数据库:一个是一百万张视网膜扫描报告,用于让 AI 软件确定退行性眼病的早期征兆;一个是通过头颈部癌症图像用于训练 AI 软件来识别健康组织和癌变组织。

其中,诊断退行性眼病的早期征兆的方案,是 Moorfields 眼科医师 Pearse Keane 最先想到这个方案,他看到 Google 如何利用 DeepMind 来学习游戏,便与 Google 联系,他相信 DeepMind 应该也可以用于眼科诊断。

尽管 Google 保证只会处于诊断和治疗目的来使用这些数据,但是这个项目还是引发了很大的争议。DeepMind 联合创始人 Suleyman 表示,公司有恰当的协议,以确保数据由医院控制。此外,公司的目标是操作尽可能透明,而且也会与第三方审计师合作。DeepMind 也在开发“通用透明架构”,将记录数据何时被访问,由谁访问等日志信息。

DeepMind 还尝试将 AI 拓展到音频领域。语音机器人很早以前,就出现在科幻小说里了。随着苹果 Siri 等产品商业化,表明了这项技术已经进入主流。但机器和人类之间的语言差异还是很大。DeepMind 开发了一套文本 - 语音转化系统,名为 WaveNet。它可以将这种差异缩小逾 50%,使用了神经网络复制人类的声波,不再像以前那样单纯复制他们使用的语言。

熟练的程序员和强大的计算设备是这类 AI 应用的关键。但是,获取足够数量的现实世界环境的数据也很重要。当医院,电网和工厂等系统的目标是利用 AI 和机器学习的技术时,需要提供具体的操作数据。

Alphabet 当然拥有海量可服务于这些目的的数据。但是,有关特定的探索领域,DeepMind 必须获取足够的数据用于训练,现有的数据远不能满足需求。它最近参加了一个研究读取唇语的项目——LipNet,取得了成功,源于团队掌握了前所未有的庞大的数据集。这项研究由计算机视觉研究者 Andrew Zisserman 为首的牛津大学的一个研究小组带领。BBC 为其提供了数十万小时的新闻录像,如果没有这些数据,根本不可能训练出 LipNet。

Hassabis 认为,未来数据获取对 DeepMind 的重要性会越来越小,他表示,工程师可以构造出用于解决问题的模型,然后在这些模型部署 DeepMind 让它进行自我学习。这种运作方式,目前大多数机器学习系统并没有掌握。
那个震惊全球、打败围棋世界冠军李世石的阿尔法狗,是先从 16 万场人类对弈的数百万个棋局中进行学习,然后才进行迭代式自我对弈,通过不断的训练,提升棋艺。这样,如果要获取大量的个人信息,它就应该考虑清楚如何应对客户们对企业数据安全的担忧。

如果 DeepMind 能顺利解决这类问题,那么它就会成为 Alphabet 的一家算法工厂,它带来的意义和价值,将远不仅仅是 AI 研究机构和人才集聚地。DeepMind 需要的数据,仍然归原本拥有者所有,这就可以解决有关隐私权的问题,但是,由其开发出来的算法,将属于 Alphabet。也许,DeepMind 无法依靠这种方式来创收,但它可以通过分析数据获取的知识或者技能,在未来的商业竞争中,将为 Alphabet 带来巨大的优势,让 Google 为竞标所付出的努力,物有所值。

近日,Elon Musk 支持的机构 OpenAI 开源了通用性人工智能 Universe,据 OpenAI 公司称,他们的目标是,开发一种单一的人工智能代理,可以灵活地将以往的经验运用在 Universe 环境上,循序驾驭不熟悉、困难的环境,这将是实现通用智能的一大步骤。

DeepMind 与 Universe 的工作方式不同。DeepMind 工作方式类似 3D 游戏平台,以第一视角来观察 3D 世界;而 Universe 则是通过代理观察屏幕像素,并生成键盘和鼠标命令来操作远程桌面。

Suleyman 说,DeepMind 的目标是“破解智能,让世界更美好”。创立 DeepMind 的初衷就是希望能够构建出达到人类智能水平的智能系统,但是,实现这个目标需要几十年。他说,“这里提到的二十年或者几十年,事实上远不止这么久。谁也无法准确预测具体时间。”在此之前,DeepMind 将专注于解决具体的问题。

对人类来说,通用性人工智能会不会是一件好事呢?让我们拭目以待。人类可以主宰自然世界的原因,并不是因为我们比其他动物更快、更强壮、更聪明,而是因为我们更智能。也许,这些会学习的人工智能是人类地平线上的乌云。也许,它们就是人类最后的发明。


感谢朱昊冰对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-12-25 18:002029
用户头像

发布了 375 篇内容, 共 190.7 次阅读, 收获喜欢 946 次。

关注

评论

发布
暂无评论
发现更多内容

和鲸科技出席第五届空间数据智能学术会议,执行总裁殷自强受邀发表主题报告

ModelWhale

人工智能 数据模型 空间数据

Lucene环境下基于NGram分词的中文高级检索

alexgaoyh

中文分词 lucene 高级检索 ngram 知网高级检索

支付系统概述(十一):运营能力

agnostic

支付系统设计与实现

2024-04-27:用go语言,在一个下标从 1 开始的 8 x 8 棋盘上,有三个棋子,分别是白色车、白色象和黑色皇后。 给定这三个棋子的位置,请计算出要捕获黑色皇后所需的最少移动次数。 需要注意

福大大架构师每日一题

福大大架构师每日一题

释放Stable Diffusion 无限可能

亚马逊云科技 (Amazon Web Services)

Amazon Lambda Amazon S3 Glacier

Linux设备驱动系列(五)——字符驱动设备文件

Linux内核拾遗

Linux内核 设备驱动

Adobe Photoshop动作导入方法详解,PS动作安装教程

Rose

ps动作

Penpad 再获 Animoca Brands 投资,全新生态历程

大瞿科技

长期看好Celestia,质押TIA教程分享,以bitget为例

股市老人

EasyExcel导出-自适应图像尺寸

alexgaoyh

EasyExcel 自适应 图像 等比缩放 导出

算子开发到推理加速,一位00后开发者的“升级打怪”之旅

Alter

开发者 昇腾AI大赛 #大模型

鸿蒙HarmonyOS实战-ArkUI组件(Menu)

蜀道山

鸿蒙 前端 HarmonyOS 鸿蒙卡片 menu

以太网口硬件知识分享

芯动大师

Mac 以太网 PHY

LED显示屏与LCD显示屏的9个区别

Dylan

LED显示屏 全彩LED显示屏 led显示屏厂家 lcd

总结反思 持续进步-开源即时通讯(IM)项目OpenIM 新版本release-v3.7发布

Geek_1ef48b

鸿蒙HarmonyOS实战-ArkUI组件(页面路由)

蜀道山

鸿蒙 架构 前端 HarmonyOS 鸿蒙系统

Penpad 再获 Animoca Brands 投资,全新生态历程

加密眼界

2016年:DeepMind给人类带来了什么?_语言 & 开发_刘志勇_InfoQ精选文章