GOOGLE 已经制造出自己的计算机芯片,而事情还远没有结束。
整个互联网上最强大的公司昨天在科技界抛出了几枚重磅炸弹,披露了全新的定制化芯片,借此这家庞大的在线帝国可以更好地经营未来的主营业务:人工智能。
为了制造自己的芯片,Google在改造了科技界的很多东西之后,又向前迈近一步。为巩固各类在线服务,过去十多年来这家公司为自己的大规模数据中心设计了各种新硬件,包括计算机服务器、网络设备等。随着服务范围和规模达到一个空前的高度,他们需要通过更高效的硬件运行这些服务。多年来,其他很多互联网巨头也曾效仿这种做法,以此为契机全球硬件市场产生了翻天覆地的变化。
Google 在芯片制造方面努力的结果辐射范围已经超越了 Google 帝国本身,甚至让芯片行业的未来受到威胁。
对于这款新芯片,Google 的目标始终未变:空前的高效。为了让 AI 技术跃上一个新高度,他们需要一种能在更低能耗前提下,用更短时间完成更多任务的芯片。但这个芯片所产生的效果已经超越了 Google 帝国本身,甚至让 Intel 和 nViaia 这样的商业化芯片制造商的未来受到威胁,尤其是考虑到 Google 对于未来的愿景,这种情况显得更为紧迫。根据在 Google 帝国的巩固之路上主要负责全球数据中心网络的Urs Hölzle 所说,新的定制芯片只是万里长征的第一步。
不,Google 不打算将自己的芯片出售给其他公司,他们不会与Intel 或nVidia 直接竞争。但考虑到这家公司的数据中心规模之大,Google 目前已经是这些芯片公司最大的潜在客户。与此同时,随着越来越多企业开始使用Google 提供的云计算服务,他们自行购买的服务器(以及芯片)数量只会越来越少,这等于进一步蚕食了芯片制造商的市场份额。
确实,Google 公布有关新芯片的新闻只是为了宣传自家的云服务业务,让更多企业和开发者选用自家的AI 引擎,并将其用于自己的应用程序中。随着Google 开始将AI 的强大能力出售给其他公司,这实际上是在(以相当高调的方式)宣称他们可以提供运行这种AI 的最佳硬件,而且绝无仅有的硬件。
Google 对速度的渴求
Google 的新芯片叫做 Tensor Processing Unit(张量处理器),即 TPU。这是因为这种芯片更适合运行 TensorFlow,正是这个软件引擎驱动着Google 的深度神经网络,硬件和软件组成的网络可以通过分析海量数据学习如何完成特定任务。其他技术巨头通常使用图形处理器,即GPU 运行自己的深度神经网络,而这GPU 最初是针对游戏和其他图形密集型应用程序的图像渲染任务设计的。虽然GPU 在设计上很适合用于运行驱动深度神经网络所需的计算任务,但Google 认为如果使用定制芯片可以进一步提高效率。
根据Google 的介绍,他们结合机器学习的具体需求对TPU 的规格进行了调整,用更少量事务就可以运行每一步操作。这意味着这样的芯片每秒钟都能执行更多操作。
目前Google 同时使用TPU* 和*GPU 运行自己的神经网络。Hölzle 拒绝详细介绍Googe 对于这种TPU 的使用方式细节,不过透露说这种技术可以处理驱动Android 手机语音识别功能所需的“部分运算量”。同时他还说Google 即将发布一篇介绍这种芯片好处的论文,并且还会继续设计能够以其他方式处理机器学习任务的新芯片。最终,他们的目标是彻底停止使用GPU。“已经取得一些进展了,”Hölzle 说:“对机器学习来说,GPU 还是不够专精,毕竟从设计上就不是针对这种用途的。”
nVidia 可不愿意听到这种说法。作为全球最主要的 GPU 经销商,nVidia 正在急迫地将自家业务拓展到 AI 领域。同时 Hölzle 也提出,最新款 nVidia GPU 包含一个专门的机器学习模式。但是很明显,Google 希望这个变化能够进行的快点,再快点。
最智能的芯片
与此同时,其他公司,尤其是 Microsoft也在芯片之路上进行着探索。场效可编程门阵列(Field-programmable gate array,FPGA)就是一种可以通过重新编程执行特定任务的芯片。Microsoft 已经测试过FPGA 在机器学习领域的运用,而Intel 也明确了市场的发展方向,最近收购了一家销售FPGA 的公司。
一些分析师认为这才是最明智的发展之路。密切关注芯片制造业务的Moor Insights and Strategy 事务所总裁兼首席分析师Patrick Moorhead 认为FPGA 可以提供更高灵活性。Moorhead 怀疑Google 新发布的TPU 是否有些“过犹不及”,并指出制造这样的芯片至少需要六个月,在竞争日趋激烈的市场中,六个月时间已经太长了,并且还要与最大的互联网公司展开竞争。
但Google 不想要这样的灵活性。对他们来说,速度的重要性超越一切。在被问到为什么Google 要从零开始制造自己的芯片而不是使用FPGA 时,Hölzle 说:“只是想实现更高的速度。”
核心业务
Hölzle 还提到 Google 的芯片并不是为了取代 CPU。中央处理器是所有计算机服务器的心脏,这个搜索巨头依然需要使用这种芯片运行数据中心内成千上万的服务器,而 CPU 是 Intel 的主营业务。当然如果 Google 愿意专门为了 AI 打造一款自己的芯片,那么人们不禁好奇他们是否打算更进一步重新设计自己的 CPU。
Hölzle 淡化了这种可能性。“只需要解决尚未解决的问题,”他说。换句话说,CPU 是一种成熟的技术,已经可以按照预期正常工作。但同时他也说,Google 希望芯片市场能够呈现出良性竞争的环境。也就是说,他们希望从多家经销商处购买,而不只是购买 Intel 的产品。毕竟更激烈的竞争对 Google 而言意味着更低的价格。同时 Hölzle 也解释说,Google 正是为了能获得更丰富的选择而与 OpenPower 基金会合作,这家机构的目标是提供任何人都可以使用和修改的芯片设计。
这是个很强大的想法,同时对全球最大的芯片制造商来说也是一个很强大的潜在威胁。根据 IDC 研究公司分析师 Shane Rau 所说,全球服务器 CPU 出货总量中有大约 5% 是 Google 购买的。他说在最近一年内,Google 购买了大约 120 万块芯片,其中大部分来自 Intel。(2012 年,Intel 高管 Diane Bryant告诉 WIRED 说 Google 从 Intel 处购买的服务器芯片数量远远超过其他五家客户,而其他这些客户全都是 _ 销售服务器 _ 的公司。)
无论对 CPU 有何计划,Google 还将继续探索更适合机器学习需求的芯片,而我们要等到很多年后才能知道什么可行,什么不可行。毕竟神经网络这个概念本身也在继续进化。“我们的探索从未中断,”他说:“但最终答案是什么我还不知道。”可以肯定的是,随着 Google 继续探索,全世界的芯片制造商都在密切关注。
作者:CADE METZ
阅读英文原文: Google’s Making Its Own Chips Now. Time for Intel to Freak Out
感谢陈兴璐对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ , @丁晓昀),微信(微信号: InfoQChina )关注我们。
评论