写点什么

英特尔 AI 转型进行时:CPU 是 AI 计算的基础但非唯一解

2019 年 6 月 27 日

英特尔AI转型进行时:CPU是AI计算的基础但非唯一解

“可以说,英特尔自己也越来越像是一家人工智能公司。”对于近几年英特尔在 AI 领域的策略和产品布局所发生的重要变化,英特尔人工智能产品事业部副总裁、人工智能产品与市场研究总经理辛周妍给出了这样的总结。

2012 年,随着深度神经网络技术的突破发展,人工智能迎来了自诞生以来的第三波高潮。在老牌芯片厂商中,最先尝到 AI 甜头的是 GPU 厂商英伟达,凭借高计算性能的图形处理器,英伟达在 AI 算力市场上一路狂奔。最初的 AI 算力市场对于英特尔来说还有点“热闹都是别人的,与我无关”的意味,但这几年英特尔正在努力改写局面。一方面,CPU 的计算能力通过软硬件协同优化不断提升,可以更好地适应 AI 场景需求,企业渐渐意识到用 CPU 做 AI 已经“足够好”;另一方面,通过收购和探索不同芯片架构,英特尔的 AI 软硬件产品组合正在不断完善。


越来越像 AI 公司的英特尔


在半导体行业,英特尔一直以来给人的印象就是资历深、实力强。他们做出了第一颗处理器、制造出了第一台微计算机、提出了摩尔定律,在长达 50 年的历史里,英特尔一直占据着半导体市场的绝对王牌地位。


但时代在变,新技术的迭代速度之快更是超出想象。随着人工智能第三波浪潮席卷而来,深度学习技术不断发展突破,一般处理器的运算性能渐渐无法满足人工智能的需求。AI 研究人员发现,原本为游戏和视频设计的 GPU 在深度学习计算上的性能远高于 CPU。2012 年,英伟达与 Google 的人工智能团队合作打造了当时最大的神经网络,随后各深度学习团队开始广泛大批量使用英伟达显卡。英伟达由此找到了新的增长机遇,并开始向 AI 计算领域转型,股价自 2014 年至今翻了几倍,可以说尝尽了 AI 时代的甜头。


新崛起的竞争对手给英特尔这家老牌大厂带来了不小的压力,但反过来也提供了更强劲的推力。随着人工智能的风越吹越劲,英特尔迈步进入 AI 转型期。对于近五年英特尔在人工智能领域的布局和进展,英特尔亚洲人工智能销售技术总监伊红卫将其总结为一句话:“整体来说就是战略上更重视,资金上更多投入,战术上覆盖到更多更广泛的领域和行业。”


在人工智能领域的产品布局上,英特尔走的是大而全路线。在硬件层面,英特尔推出了非常完整的产品组合:从边缘端到数据中心,从专用到通用芯片,涵盖 CPU、GPU、FPGA,加速器、内存、存储、网络等都有新产品陆续推出。同时,英特尔在软件方面也做了大量的提升和优化工作,帮助硬件性能发挥到极限。比如数学库层面,英特尔持续对各类库 / 基元(例如英特尔 MKL/MKL-DNN、clDNN、DAAL 等)进行优化,并推出了 nGraph 编译器,旨在使各类框架能够在任意目标硬件上实现最佳性能。在框架层面英特尔对当前最流行的深度学习框架都做了优化以提升性能,包括 TensorFlow、Caffe、BigDL、MxNet,并基于 BigDL 和 Analytics Zoo 构建了统一的大数据分析与人工智能平台。在工具层面,英特尔也推出了多种工具来帮助数据科学家加速人工智能的开发,比如去年开源的 OpenVINO 可以让开发者更简单地在边缘设备上部署视觉计算和深度学习能力。



英特尔人工智能产品事业部副总裁、人工智能产品与市场研究总经理辛周妍在接受 InfoQ 采访时强调:“英特尔人工智能的优势和独特之处不仅仅在于某一个产品,不是某一个处理器,也不是某一个内存、某一个制造的能力或某一个互联的能力,而是涵概上述所有因素在内的所有组件,使得英特尔能够建立一个完整的人工智能基础架构,非常丰富的产品组合是英特尔与其他公司实现差异化的最大亮点。”


值得一提的是,2018 年底英特尔提出了 One API 概念,该项目旨在提供一个统一的编程模型,以简化跨不同计算架构的应用程序开发工作,预计将在 2019 年第四季度发布开发者测试版本。据了解,One API 支持直接编程和 API 编程,并将提供统一的语言和库,可以在包括 CPU、GPU、FPGA 和 AI 加速器等不同硬件上,提供完整的本地代码性能。业内现在还常常出现“AI 是在 CPU 上做更好还是在 GPU 上做更好”的争论,有了 One API 之后,这将不再是一个需要头疼的问题,开发者完全可以根据工作负载的需要,灵活选择到底是在 GPU 上实现还是在 CPU 上实现。


此外,这几年英特尔的收购步伐也没有停歇。据某证券机构统计,过去 5 年,英特尔旗下的 Intel Capital 是全球 AI 投资最激进的机构之一。人工智能时代的重要细分领域,英特尔目前都有布局:FPGA 芯片巨头 Altera、深度学习公司 Nervana、自动驾驶行业领导者 Mobileye、机器视觉芯片厂商 Movidius 都已经被英特尔收入囊中。在英特尔 2019 年第一季度财报中,Mobileye 部门营收为 2.09 亿美元,同比增长 38%,表现亮眼。这几项重要收购使英特尔能够快速获得重要的新技术,也进一步丰富了英特尔的整个 AI 产品组合。在辛周妍看来,这些都让“英特尔越来越像是一家人工智能公司了。”


从应用情况来看,目前,英特尔至强系列处理器正在被越来越多地用在机器学习和深度学习类型的工作负载之中,并成为了人工智能计算的一个基础所在。换言之,英特尔已经成为为用户提供 AI 计算能力的一个重要供应商。尤其在人工智能最主要的工作负载类型数据中心场景,至强可扩展处理器已经得到了非常普遍的使用。据英特尔官方数据,当前数据中心的 AI 推理工作有近 90%是在英特尔的芯片上完成的。


将以数据为中心进行到底


我们正处于一个数据变革的时代,人类历史上 90%的数据都是在过去几年产生的,而 50%的数据又是短短两年内产生的。利用数据分析和人工智能,企业可以对海量数据进行分析、归纳、总结,提取精准并且复杂的数据关联和商业洞察,提升生产效率,扩大竞争优势,所以在过去的一段时间数据分析和人工智能得到了空前的发展。但据英特尔统计,到目前为止只有 2%的数据是真正经过分析并产生价值的。为了抓住“数据红利”,早在三年前,英特尔就提出了要从处理器制造商身份转型为数据公司,并不断致力于提升以数据为中心的业务占比。作为深度学习浪潮的三驾马车之一,数据在“后深度学习”时代同样发挥着至关重要的作用。


早前业界就有观点认为“深度学习不是人工智能的未来”,近期清华大学张钹院士也在一次采访中表示“深度学习的技术潜力已经接近天花板”。那么深度学习是否已经面临瓶颈?未来将何去何从?英特尔架构图形与软件集团副总裁和数据分析技术总监马子雅在采访中向记者表示,深度学习代表的是算法,或许今天算法已经到了瓶颈,因为过去几十年算法能做的改进都已经做了,但如果能挖掘出剩下 98%的数据的价值,或许又会给算法带来新的发展突破口。


人工智能、数据分析界在此问题上长期以来有两派意见:


  • 一派意见认为人工智能的发展一定要通过对算法的不断提升才能真正把人工智能推到一个新的台阶;

  • 另一部分做数据分析起家的人则认为人工智能只做算法是不行的,如果不能更好地利用、分析数据,人工智能很快就会达到瓶颈。


在马子雅看来,二者是相辅相成的,就如同事物发展规律一样,虽然过程中会有曲折回复,但最终是呈上升趋势的。


利用数据进一步推动人工智能的发展,会将人工智能带入到一个新台阶。可能很快我们发现数据带来的变革又达到了一个新的瓶颈,这时候也许进一步推进新的算法,能够让它再上一个台阶。


正因如此,如何做好剩下 98%尚未产生价值的数据的挖掘,对于英特尔在 AI 时代的转型尤为重要,这也与英特尔在帮助各行各业落地 AI 应用过程中收到的客户反馈不谋而合。英特尔亚洲人工智能销售技术总监伊红卫告诉我们,在人工智能大规模应用过程中,客户最大的痛点就是数据,要么没有足够的数据,要么数据质量不够好。人工智能要走出实验室、实现落地,需要一个完整的数据分析流水线。这个流水线的 20%可能是在做深度学习,但是 80%都是在做数据收集、数据存储、数据管理、数据清理、数据预处理等等,这是为什么早前英特尔开源了BigDL的重要原因。



当然,企业 AI 落地的节奏会因为迫切性的不同而有所区别。比如,AI 在互联网公司已经得到非常广泛的应用,包括千人千面的消息推送、智能推荐、智能客服等。企业客户则不同,他们是否有足够强的 AI 落地需求,取决于是否能很快看到 AI 落地的回报。以银行的风险控制为例,哪怕只是将准确率提高 10%,可能就会节省上亿美元,因此银行金融业落地 AI 的迫切性就非常强。而有的企业应用 AI 是为了改善客户体验,就需要计算投入产出比,这与行业属性强相关。


但数据是企业落地 AI 共同的“痛”,到底能否落地要看企业过去的数据积累情况。目前银行、医疗行业的 AI 落地案例很多,很重要的前提就是这些行业有长期的数据积累和沉淀,并且最近几年移动互联、互联网的发展进一步促进了行业数据的爆发。虽然交通、制造等各个行业都希望能够尽快落地 AI,但前提还是要看有没有完整的数据、标注好的数据。


自然而然的,数据中心成为了接下来 AI 算力基础设施提供商的兵家必争之地。


在今年 5 月初的年度投资者会议上,英特尔宣布了一系列全新的产品路线图及工艺路线图,宣告到 2023 年营收将达到 850 亿美元。在实现这个目标的过程中,数据中心市场尤其重要,英特尔认为,2023 年芯片市场价值将高达 3000 亿美元,而数据中心市场至少有 2000 亿美元。今年 6 月,英特尔刚刚宣布收购网络芯片公司 Barefoot Networks,旨在帮助英特尔数据中心团队满足超大规模云客户快速变化的需求。


无独有偶,英伟达也在 3 月份以创纪录的 69 亿美元现金收购以色列芯片设计公司 Mellanox,希望借助 Mellanox 的技术为其数据中心芯片业务提供支持。对英伟达来说,数据中心芯片市场是其未来另一个重要的业务方向,通过将业务转移到数据中心芯片的生产上,可以降低对游戏行业的依赖。


据最新财报显示,2019 年第一财季英特尔的数据中心(DCG)业务营收为 49 亿美元,而英伟达的数据中心业务部门收入为 6.34 亿美元。与前文 2000 亿美元的未来市场价值相比,现在的数据中心市场还有巨大的增长潜力,留给英特尔施展拳脚的空间很大。


AI 计算迈入超异构时代,CPU 不是唯一解


除了算法和数据,计算力的提升也是人工智能发展突破强大的助推力。事实上,过去几年间计算力一直在以惊人的速率增长。在英特尔看来,计算力指数级上升的实现是基于硬件与软件的协同创新。


对于全新硬件架构的每一个数量级的性能提升潜力,软件能带来超过两个数量级的性能提升。


英特尔首席架构师 Raja Koduri 最近在不同场合多次强调了英特尔的技术愿景。对英特尔而言,就是要提供多样化的标量、矢量、矩阵和空间架构组合,以先进制程技术进行设计,由颠覆性内存层次结构提供支持,通过先进封装集成到系统中,使用光速互连进行超大规模部署,提供统一的软件开发接口以及安全功能,从而实现超异构计算的技术愿景。这一技术愿景中涵盖了英特尔提出的六大技术支柱,不只制程,还包括封装、架构、内存和存储、互连、安全、软件。


在硬件层面,马子雅表示未来的计算力不能局限于 CPU 一种,尤其是对 AI 来说,需要通过多种多样的硬件形式,才能保证计算力再固定以每几年翻一番的速度继续下去。未来的 AI 硬件可能不是集中在通用芯片上,有时候是专用和通用的结合。


另外,英特尔的硬件图景不只集中在计算,针对存储,英特尔开发了“傲腾”技术,另外英特尔也已经做了很久的网络架构技术。英特尔的人工智能的组合绝不仅仅是只包括某一个芯片产品。英特尔认为,没有一种方案能解决所有问题(One size doesn’t fit all),多样化的产品组合才能满足不同人工智能应用的需求。在英特尔的硬件图景中,GPU 方面的工作也是其中一个组成部分。未来十年的计算创新由架构驱动,英特尔的优势在于,可以将标量(CPU)、矢量(GPU)、矩阵(AI)和空间(FPGA)等不同架构整合到系统级平台和系统级封装,同时也在进行架构创新的新探索,比如 Loihi 神经拟态计算芯片、量子计算。



有了多种多样的硬件形式还不够,软件也是 AI 解决方案中非常关键的一环。某种程度而言,软件就好像一条道路,能够带领用户走到最优表现的终点。在软件层面,英特尔的策略是一个架构围绕一个架构打造所有功能,并在横跨 PC、网络和数据中心的所有领域中利用这个架构。归纳起来,英特尔的软件使命主要有三点:第一,简便和可扩展,不仅可以扩展到所有的架构,更可以扩展到所有的操作系统,能够从一个节点扩展到生态系统中的数百万台互联设备;第二是开放性,向所有人开放标准;第三是统一的开发体验。英特尔希望通过实现这三个目标,解决计算异构性的问题。


在人工智能这一领域,英特尔将自己看作 AI 全栈式解决方案提供者,针对不同场景提供不同的软硬件组合,帮助企业真正将人工智能应用到生产环境中。马子雅表示:很多年前英特尔刚开始做人工智能的时候,经常会认为客户的第一兴趣点是性能,也就是模型训练的性能越高越好。但事实上,怎么把已有的数据和人工智能更容易地整合起来、怎么在现有的数据架构和基础设施上把 AI 功能跑起来,对客户来说才是最重要的。性能更好当然欢迎,但这并不是很多客户首要追求的。针对不同企业更不相同的 AI 需求,如何提供最好的解决方案?马子雅认为最行之有效的办法是先了解客户的工作负载是什么,然后找到相应的软硬件结合来解决工作负载问题。英特尔即将在 2019 年四季度推出的“One API”项目就是为简化跨 CPU、GPU、FPGA、人工智能和其它加速器等各种计算引擎的编程而生。


AI 计算如今已经迈入超异构时代,硬件只是 AI 超级生态中的一个环节,以数据为中心的未来还需要更完整的系统思考,单一因素已经不足以满足多元化的未来计算需求,软硬件协同创新势在必行。


相关文章:


英特尔首席架构师 Raja 独家解读:如何以指数级思维引领创新


从开源 BigDL 和 Analytics Zoo,看懂英特尔的 AI 底气


英特尔 BigDL 设计思路解析:落地深度学习要具备工业级大数据分析流水线


2019 年 6 月 27 日 14:204419
用户头像
蔡芳芳 InfoQ高级编辑

发布了 508 篇内容, 共 232.5 次阅读, 收获喜欢 1419 次。

关注

评论

发布
暂无评论
发现更多内容

week04 作业

xxx

java安全编码指南之:线程安全规则

程序那些事

java安全编码 java安全 java安全编码指南 java代码规范 java代码安全

架构师训练营第2期 第1周 作业一:食堂就餐卡系统设计

老坛酸菜

Docker架构

混沌畅想

Docker 容器 Docker架构

架构师训练营第2期 第1周 作业二:学习总结.md

老坛酸菜

App场景下投放外链时如何做设备识别和采集(1)

DeeperMan

采集 流量

听说你会缓存?

架构师修行之路

redis 缓存 微服务

服了,这款开源类库可以帮你简化每一行代码

沉默王二

Java GitHub 后端 hutool

编码之路,与君共勉

yes的练级攻略

程序人生

一份超级完整实用的PyCharm图解教程,8K字赶紧收藏起来

计算机与AI

Python IDLE 开发环境

如果只推荐一本 Python 书,我要 Pick 它!

Python猫

Python 学习 编程 程序员 码农

架构作业:一致性hash

Nick~毓

C/C++最佳实践

jiangling500

c c++ 最佳实践

week04总结

xxx

甲方日常 36

句子

工作 随笔杂谈 日常

分布式缓存架构,消息队列,负载均衡

garlic

极客大学架构师训练营

c++bind函数使用

良知犹存

c++

6小时搞定云原生:从基础概念到上手实践

京东智联云开发者

云原生

Linux内核系统结构

林昱榕

Linux 操作系统 内核 系统调用 操作系统结构

数字货币交易所开发功能方案,交易所平台搭建app

WX13823153201

数字货币交易所开发

Java中的5大队列,你知道几个?

王磊

Java

【得物技术】谈谈缓存的一二三四五

得物技术

缓存 架构 技术 缓存穿透 缓存击穿

一致性 hash

garlic

极客大学架构师训练营

Week 4学习总结

balsamspear

极客大学架构师训练营

spring-boot-route(二十三)开发微信公众号

Java旅途

Java Spring Boot

设计数据库集群读写分离并非易事

架构师修行之路

分布式 微服务

epoll服务器解析

菜鸟小sailor 🐕

一文读懂线程池的工作原理(故事白话文)

捡田螺的小男孩

Java 面试 线程池 线程池工作原理

二十一、深入Python强大的装饰器

刘润森

Python

Week 4命题作业

balsamspear

极客大学架构师训练营

一文搞懂ReactNative生命周期的进化

凌宇之蓝

react.js 面试 大前端 React Native

NLP领域的2020年大事记及2021展望

NLP领域的2020年大事记及2021展望

英特尔AI转型进行时:CPU是AI计算的基础但非唯一解-InfoQ