HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

以最新发布的含光 800 为引,看阿里在芯片领域都下了哪些“棋”

  • 2019-10-08
  • 本文字数:4303 字

    阅读完需:约 14 分钟

以最新发布的含光800为引,看阿里在芯片领域都下了哪些“棋”


9 月 25 日,阿里在此次云栖大会上落子清脆,其借助平头哥在整个“芯片棋盘”的布局已经初具规模。


至此,阿里旗下平头哥集齐了 AI 芯片(含光 800)、一站式芯片设计平台(无剑 SoC 平台)和高性能处理器 IP(玄铁系列),端云一体全栈芯片产品家族的雏形已然显现。


阿里巴巴 CTO 张建锋在此次云栖大会的主论坛上表示,含光芯片将是阿里芯片万里长征的第一步。

含光剑出,天下谁人不识君

既是第一步,那便迈出气势。


云栖大会首日主论坛上,阿里巴巴宣布全球最高性能 AI 推理芯片含光 800 正式发布。在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。



含光 800 是阿里成立平头哥芯片公司后第一款正式流片的芯片。目前,该芯片已经开始应用于阿里巴巴内部的核心业务中。同时,含光 800 将通过阿里 AI 云服务为各企业的 AI 场景输出 AI 算力。


AI 芯片是人工智能场景最高效的算力单元,阿里表示将投入重金打造好这些技术,同时构建应用生态。


在 AI 场景中,含光 800 是异构计算的很好补充。据悉,未来其产品形态还会进一步完善,包括云端 AI 训练芯片和端侧 AI 推理芯片,平头哥还在研发用于阿里云神龙服务器的 SoC 专用芯片,以满足更多场景的算力需求。

含光芯片为什么是 800?

含光 800 是阿里含光系列的第一款 AI 云端专用推理芯片,却被冠以 800 的名称,其内在含义并不是因为它的前面有多少款其他芯片,而是代表着芯片的级别。含光 800 在阿里的内部定位属于比较高端的一款芯片,所以取名 800。


而且其他芯片商都会有类似的命名方法,从这个角度来看,阿里还可能在以后的日子里,陆续推出名为 600 的中端产品,300 的低端产品,等等。

含光芯片微架构的创新之处

含光芯片的架构设计,关键在于阿里内部的 AI 算法团队,平头哥通过对其内部 AI 算法的通用特征提取,实现了芯片架构的创新。


具体而言,含光芯片在架构设计中主要做了这些创新:


  • 减少内存带宽


内存访问会造成芯片较大的功耗损失,平头哥自研架构通过缩短物理距离,将计算单元与存储单元尽可能的靠近,当遇到高密度计算和存储时,就可以很大程度上减少对内存的访问,并在保证性能的情况下,降低芯片功耗。


  • 组合算子优化融合


含光 800 芯片把最常用的组合算子做优化融合。根据神经网络推理运算特征,设计特定的硬件神经元、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。


  • 算法压缩


采用稀疏、量化等推理加速技术,对算法、模型进行压缩。比较突出的一点是基本实现全网络量化,尽可能的使所有数据在存储时按照压缩的形式存入内存,并在计算过程中,根据精度要求把数据做拓展,保持其较高精度。


  • 计算中高度并行处理


含光 800 芯片深度优化 CNN 及视觉类算法,在计算里面具有高度并行性,不仅可以加速计算矩阵、乘法、卷积等,还可以加速向量、激活函数等。

玄铁初试,锋芒渐露

与含光 800 不同,玄铁系列处理器 IP 早在今年 7 月份就已经正式发布,而且一经问世,便被当作阿里的一把“玄铁重剑”。


当时还在奇怪,为什么阿里会选择发布这样一款芯片 IP,而不是进行大规模流片。对此,在本次的云栖大会上,阿里给出了这样的答案:玄铁是铸就各大神剑的原材料



玄铁系列处理器,目前主要分为 8 系列和 9 系列。玄铁 8 系列处理器是具有自主知识产权,中国唯一规模量产的 CPU,授权芯片累计出货量达 10 亿颗;玄铁 9 系列处理器 IP,是目前单位性能最强的RISC-V处理器,相比同类产品性能提高 40%。


在云栖大会首日下午的平头哥生态论坛上,平头哥官宣 IP 联盟和发布《云端设计白皮书》,并携手清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图等公司连发 7 款基于玄铁处理器的芯片。当日,天猫精灵与平头哥合作研发的智能语音芯片也正式发布,将用于即将推出的天猫精灵音箱中。

7 款玄铁系列芯片,强大朋友圈助力平头哥芯片生态

平头哥的玄铁系列处理器和无剑平台目前拥有 100 多家客户,在此次的云栖大会上,平头哥携手清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图等公司连发 7 款基于玄铁处理器的芯片,分别涵盖视觉、语音、微控制、无线芯片等多种应用领域。


这 7 家公司既有垂直行业领军者,也有新兴领域后起之秀。炬芯是国内最老牌的 IC 设计企业之一,云天励飞是业界知名的 AI 独角兽。清微智能、联盛德、博雅鸿图则在可重构计算芯片、物联网通信芯片和数字视网膜芯片领域各有专长。


艾派克在中国打印机主控芯片市场占有龙头地位,预计今年搭载平头哥内核的艾派克芯片出货量将达 2 亿颗。蓝牙芯片新锐企业奉加微今年年初获得平头哥玄铁 802 MCU、YoC 操作系统及 CSI 外设接口授权,用 6 个月就完成了芯片设计。


以下是 7 家客户和芯片的基础信息:


铸剑台——无剑

本次云栖大会上,平头哥给自己的定位是:做 AIoT 时代芯片基础设施的提供者。


何为基础设施?它指的是完成一项工作所需的基本材料,以及这些材料的服务支撑体系和如何使用的方法等等。


AIoT 市场本身便是一个碎片化市场,各种端测设备对于功耗、性能、成本要求都不一样。所以除了玄铁系列处理器 IP 外,一站式芯片设计平台无剑则是其实现自身定位的重中之重。



作为系统芯片开发的基础共性技术平台,无剑由 SoC 架构、处理器、各类 IP、操作系统、软件驱动和开发工具等模块构成。平台能够承担 AIoT 芯片约 80% 的通用设计工作量,让芯片研发企业专注于剩余 20% 的专用设计工作,降低系统芯片的研发门槛,提高研发效率和质量,让定制化芯片成为可能。


目前,无剑已推出 MCU、语音、视觉三大平台,后续还会有更多平台推出。MCU 平台有 5 类 IP,3 家合作伙伴;语音识别平台有 8 类 IP,3 家合作伙伴;机器视觉平台有 9 类 IP,3 家合作伙伴。

什么是一站式芯片设计平台?

据了解,无剑平台是集芯片架构、基础软件、算法与开发工具等一体的整体解决方案:


面向硬件:为了充分发挥各种不同硬件的效能,研发人员打造了一个多场景灵活可配置的异构 AI 加速引擎框架,这里的 AI 加速引擎可以是用户自定义的。平头哥提供神经网络加速库及异构编译器技术,向芯片厂商提供多粒度的硬件抽象接口;芯片厂商可以根据硬件特征(无论是面向低功耗低沉本的语音芯片还是高性能高实时性的视觉芯片),快速对接到 AI 加速引擎,并高效地发挥其硬件性能。该引擎支持当前所有主流框架,几乎所有的标准模型都能够在上面一键部署;它也提供一套便捷的自定义层开发接口,方便开发者多样化需求。


面向应用开发:研发人员开发了一套标准统一的应用开发框架,同一个应用可以在不同算力的硬件上进行无缝迁移。另外,为了进一步降低使用难度,提升开发效率,平头哥集成开发环境完美融合该引擎,并添加一键部署、图形化算力分析、异构多核联合调试等功能,解决实际开发过程中最困难的问题。根据实际客户开发数据的统计,整个软件框架可为芯片厂商节省 60% 的 AI 基础软件开发成本,缩短方案厂商 50% 的应用开发时间。

无剑 SoC 平台的目标是助力芯片的差异化

据阿里巴巴称,取名无剑的目的是要以“超越常规”的方式做芯片。


无剑平台的目标并不是去做某一个具体的芯片,而是致力于把共性的基础工作做好,能够给客户提供完整的解决方案和可参考的设计,使客户做芯片时只需要针对行业的需求开发特有的内核技术。


另外,无剑平台的特点是“端云一体”、“软硬件深度融合”和“全栈集成”,通过基于共性技术开展设计,整个研发到量产的周期有望缩短 50%,通过跳过 MPW、缩短软硬件开发的人力成本,有望使得 NRE 费用降低 50%。

平头哥的“芯”战略

云端 AI 芯片含光 800,端侧处理器 IP 玄铁系列,再加上 SOC 芯片设计平台无剑,平头哥的“芯”战略展露无疑:


通过端侧的各种处理器 IP,以及芯片设计平台,降低各大芯片公司造芯的门槛;通过云端 AI 芯片,对阿里云及各企业用户进行智能化升级。

平头哥的共性技术体系:云端协同

在云侧,平头哥发布了含光 800 芯片,除此之外,平头哥还在做 MOC 相关的芯片;在端侧,平头哥更加注重生态合作,与行业合作伙伴共同开展芯片的设计,并提供玄铁处理器 IP、无剑 SoC 平台、AliOS 与基础软件以及面向领域算法提供的各种基础设施。


云和端看似两个不同的领域,从平头哥的角度看是一致的,云和端都是向行业释放算力。云侧,基于自有芯片、阿里云,提供算力;端侧,通过提供处理器 IP 与无剑平台这种面向行业的基础设施,进行相关赋能。

平头哥是“新手”?

2018 年 9 月,阿里巴巴云栖大会上,阿里巴巴 CTO 和达摩院院长张剑锋宣布成立平头哥半导体有限公司,推进云端一体化的芯片布局。这家公司由阿里此前收购的中天微系统有限公司和达摩院自研芯片业务整合而成。


虽然阿里自谦在全球芯片领域只是一个新人,但平头哥却并没有表面上仅成立一年那么简单,换句话说,如今阿里在芯片领域的成就,完全是平头哥厚积薄发的结果。


算上中天微的 19 年,以及阿里巴巴在服务器、FPGA 以及存储等硬件基础设施上早年的摸索,这些经年累月的研发经验使平头哥在体系结构、编译技术等领域拥有深厚的技术储备。

未来平头哥在芯片方面的规划

对于未来平头哥在芯片方面的规划,骄旸是这样说的:


从长远的规划上会对一些技术点深入挖掘。比如 AI 领域,虽然含光已经取得一些初步成果,但还远远不够,平头哥还有很长的路要走。


另外,关于未来芯片开发社区,将主要呈现基于平头哥基础设施的芯片产品,平头哥对芯片基础架构的统一会对软件开发产生积极的作用,而且这也会使得 IoT 开发者更加专注于行业的需求,做出有行业特色的有竞争力的产品。


总结而言,对于 IoT 芯片行业,平头哥不仅需要技术创新,同时也需要有合作模式的创新。芯片是技术性很强的行业,违背行业规律做事基本上很难成功,但除了技术还需要模式的创新。应用驱动在当前的 IoT 市场使得后来者更有优势,开放的合作是 IoT 芯片生态中必须要做的,平头哥希望未来的 IoT 芯片生态能够实现整个系统的普惠共赢。

写在后面

阿里拥有庞大的电商、金融、物流、云计算、物联网等业务,对于芯片的需求也越来越大。着力于芯片,不仅可以降低阿里整体计算的经济成本,还能以云服务的方式将更高算力、更低功耗提供给更多企业。


自去年平头哥成立以来,到现在含光 800 的正式发布流片,短短的一年时间里,平头哥便已经开始反哺阿里,为其提供芯片领域的各种支持,而平头哥的成立正是其顺应趋势的结果。


种种迹象表明,芯片、AI 与云计算三位一体的协调发展已经成为目前的主流趋势。各大公司或将根据 AI 算法设计制作芯片,通过专用 AI 芯片为云服务提供更强算力,再利用云计算加速了 AI 应用的大规模落地,进而形成了一个高效的闭环环境。


2019-10-08 15:052339
用户头像
张之栋 前InfoQ编辑

发布了 91 篇内容, 共 49.1 次阅读, 收获喜欢 159 次。

关注

评论

发布
暂无评论
发现更多内容

KunlunBase对MySQL私有DML语法的支持

KunlunBase昆仑数据库

国产数据库

共享自助洗车是车主自己洗吗?

共享电单车厂家

共享自助洗车 自助洗车加盟 车白兔自助洗车

KunlunBase功能之insert/update/delete...returning语句

KunlunBase昆仑数据库

国产数据库

ORACLE进阶(十四)转义字符讲解

No Silver Bullet

oracle delete 转义字符 7月月更 TRUNCATE

阿里内网GC面试小册,仅7天Github获赞96.9K

程序知音

Java 阿里巴巴 程序员 后端 JVM

性能测试中的随机数性能问题探索

FunTester

大数据ZooKeeper(一):基本知识和集群搭建

Lansonli

大数据 zookeeper 7月月更

【容器篇】Docker实现资源隔离的秘籍

技术小生

Docker 7月月更

SVN 修订版本关键字

攻城狮杰森

svn 关键字 7月月更

面试官:Linux操作系统里一个进程最多可以创建多少个线程?

Java全栈架构师

程序员 多线程 操作系统 计算机 java面试

KunlunBase 0.9.1版本Sysbench性能测试报告

KunlunBase昆仑数据库

国产数据库

2022数十位Java架构师汇总产出,最新25个技术栈“Java面经”

程序知音

Java 程序员 面试 后端 八股文

KunlunBase指导手册(二)对等部署最佳实践

KunlunBase昆仑数据库

国产数据库

KunlunBase指导手册(三)数据导入&同步

KunlunBase昆仑数据库

国产数据库

什么是“企业级”低代码?成为企业级低代码必须具备的5种能力

优秀

低代码 企业级低代码平台

商品管理功能越来越丰富,不愧是 Pro 系统!

CRMEB

自助洗车更轻松更自在的洗车方式

共享电单车厂家

自助洗车 自助洗车加盟 车白兔自助洗车

A tour of gRPC:04 - gRPC unary call 一元调用

BUG侦探

gRPC RPC protocolBuffer

KunlunBase的Fullsync高可用机制简介

KunlunBase昆仑数据库

国产数据库

腾讯一面:内存满了,会发生什么?

程序员小毕

程序员 腾讯 面试 程序人生 计算机

无人自助洗车项目如何?好不好做

共享电单车厂家

自助洗车加盟 车白兔自助洗车 无人自助洗车项目

小数据量用户场景使用KunlunBase的价值

KunlunBase昆仑数据库

拔掉网线几秒,再插回去,原本的 TCP 连接还存在吗?

程序员小毕

程序员 程序人生 计算机网络 java面试 TCP协议

KunlunBase 指导手册(一)快速安装手册

KunlunBase昆仑数据库

国产数据库

心寄开源,合规护航!2022 开放原子全球开源峰会开源合规分论坛即将开幕

kk-OSC

开源 开源峰会 开放原子全球开源峰会 开源合规

Kunlun-Storage vs PostgreSQL OLTP 测试

KunlunBase昆仑数据库

国产数据库

KunlunBase 读写分离方案

KunlunBase昆仑数据库

美团二面:为什么Redis会有哨兵?

Java全栈架构师

Java redis 程序员 面试 后端

为安全而生!云安全漫谈开讲啦

云安全 云计算运维

KunlunBase指导手册(四)从 Oracle 实时同步数据到 KunlunBase

KunlunBase昆仑数据库

国产数据库

昆仑数据库 MySQL 连接协议简介

KunlunBase昆仑数据库

国产数据库

以最新发布的含光800为引,看阿里在芯片领域都下了哪些“棋”_AI&大模型_张之栋_InfoQ精选文章