写点什么

以最新发布的含光 800 为引,看阿里在芯片领域都下了哪些“棋”

  • 2019-10-08
  • 本文字数:4303 字

    阅读完需:约 14 分钟

以最新发布的含光800为引,看阿里在芯片领域都下了哪些“棋”


9 月 25 日,阿里在此次云栖大会上落子清脆,其借助平头哥在整个“芯片棋盘”的布局已经初具规模。


至此,阿里旗下平头哥集齐了 AI 芯片(含光 800)、一站式芯片设计平台(无剑 SoC 平台)和高性能处理器 IP(玄铁系列),端云一体全栈芯片产品家族的雏形已然显现。


阿里巴巴 CTO 张建锋在此次云栖大会的主论坛上表示,含光芯片将是阿里芯片万里长征的第一步。

含光剑出,天下谁人不识君

既是第一步,那便迈出气势。


云栖大会首日主论坛上,阿里巴巴宣布全球最高性能 AI 推理芯片含光 800 正式发布。在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。



含光 800 是阿里成立平头哥芯片公司后第一款正式流片的芯片。目前,该芯片已经开始应用于阿里巴巴内部的核心业务中。同时,含光 800 将通过阿里 AI 云服务为各企业的 AI 场景输出 AI 算力。


AI 芯片是人工智能场景最高效的算力单元,阿里表示将投入重金打造好这些技术,同时构建应用生态。


在 AI 场景中,含光 800 是异构计算的很好补充。据悉,未来其产品形态还会进一步完善,包括云端 AI 训练芯片和端侧 AI 推理芯片,平头哥还在研发用于阿里云神龙服务器的 SoC 专用芯片,以满足更多场景的算力需求。

含光芯片为什么是 800?

含光 800 是阿里含光系列的第一款 AI 云端专用推理芯片,却被冠以 800 的名称,其内在含义并不是因为它的前面有多少款其他芯片,而是代表着芯片的级别。含光 800 在阿里的内部定位属于比较高端的一款芯片,所以取名 800。


而且其他芯片商都会有类似的命名方法,从这个角度来看,阿里还可能在以后的日子里,陆续推出名为 600 的中端产品,300 的低端产品,等等。

含光芯片微架构的创新之处

含光芯片的架构设计,关键在于阿里内部的 AI 算法团队,平头哥通过对其内部 AI 算法的通用特征提取,实现了芯片架构的创新。


具体而言,含光芯片在架构设计中主要做了这些创新:


  • 减少内存带宽


内存访问会造成芯片较大的功耗损失,平头哥自研架构通过缩短物理距离,将计算单元与存储单元尽可能的靠近,当遇到高密度计算和存储时,就可以很大程度上减少对内存的访问,并在保证性能的情况下,降低芯片功耗。


  • 组合算子优化融合


含光 800 芯片把最常用的组合算子做优化融合。根据神经网络推理运算特征,设计特定的硬件神经元、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。


  • 算法压缩


采用稀疏、量化等推理加速技术,对算法、模型进行压缩。比较突出的一点是基本实现全网络量化,尽可能的使所有数据在存储时按照压缩的形式存入内存,并在计算过程中,根据精度要求把数据做拓展,保持其较高精度。


  • 计算中高度并行处理


含光 800 芯片深度优化 CNN 及视觉类算法,在计算里面具有高度并行性,不仅可以加速计算矩阵、乘法、卷积等,还可以加速向量、激活函数等。

玄铁初试,锋芒渐露

与含光 800 不同,玄铁系列处理器 IP 早在今年 7 月份就已经正式发布,而且一经问世,便被当作阿里的一把“玄铁重剑”。


当时还在奇怪,为什么阿里会选择发布这样一款芯片 IP,而不是进行大规模流片。对此,在本次的云栖大会上,阿里给出了这样的答案:玄铁是铸就各大神剑的原材料



玄铁系列处理器,目前主要分为 8 系列和 9 系列。玄铁 8 系列处理器是具有自主知识产权,中国唯一规模量产的 CPU,授权芯片累计出货量达 10 亿颗;玄铁 9 系列处理器 IP,是目前单位性能最强的RISC-V处理器,相比同类产品性能提高 40%。


在云栖大会首日下午的平头哥生态论坛上,平头哥官宣 IP 联盟和发布《云端设计白皮书》,并携手清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图等公司连发 7 款基于玄铁处理器的芯片。当日,天猫精灵与平头哥合作研发的智能语音芯片也正式发布,将用于即将推出的天猫精灵音箱中。

7 款玄铁系列芯片,强大朋友圈助力平头哥芯片生态

平头哥的玄铁系列处理器和无剑平台目前拥有 100 多家客户,在此次的云栖大会上,平头哥携手清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图等公司连发 7 款基于玄铁处理器的芯片,分别涵盖视觉、语音、微控制、无线芯片等多种应用领域。


这 7 家公司既有垂直行业领军者,也有新兴领域后起之秀。炬芯是国内最老牌的 IC 设计企业之一,云天励飞是业界知名的 AI 独角兽。清微智能、联盛德、博雅鸿图则在可重构计算芯片、物联网通信芯片和数字视网膜芯片领域各有专长。


艾派克在中国打印机主控芯片市场占有龙头地位,预计今年搭载平头哥内核的艾派克芯片出货量将达 2 亿颗。蓝牙芯片新锐企业奉加微今年年初获得平头哥玄铁 802 MCU、YoC 操作系统及 CSI 外设接口授权,用 6 个月就完成了芯片设计。


以下是 7 家客户和芯片的基础信息:


铸剑台——无剑

本次云栖大会上,平头哥给自己的定位是:做 AIoT 时代芯片基础设施的提供者。


何为基础设施?它指的是完成一项工作所需的基本材料,以及这些材料的服务支撑体系和如何使用的方法等等。


AIoT 市场本身便是一个碎片化市场,各种端测设备对于功耗、性能、成本要求都不一样。所以除了玄铁系列处理器 IP 外,一站式芯片设计平台无剑则是其实现自身定位的重中之重。



作为系统芯片开发的基础共性技术平台,无剑由 SoC 架构、处理器、各类 IP、操作系统、软件驱动和开发工具等模块构成。平台能够承担 AIoT 芯片约 80% 的通用设计工作量,让芯片研发企业专注于剩余 20% 的专用设计工作,降低系统芯片的研发门槛,提高研发效率和质量,让定制化芯片成为可能。


目前,无剑已推出 MCU、语音、视觉三大平台,后续还会有更多平台推出。MCU 平台有 5 类 IP,3 家合作伙伴;语音识别平台有 8 类 IP,3 家合作伙伴;机器视觉平台有 9 类 IP,3 家合作伙伴。

什么是一站式芯片设计平台?

据了解,无剑平台是集芯片架构、基础软件、算法与开发工具等一体的整体解决方案:


面向硬件:为了充分发挥各种不同硬件的效能,研发人员打造了一个多场景灵活可配置的异构 AI 加速引擎框架,这里的 AI 加速引擎可以是用户自定义的。平头哥提供神经网络加速库及异构编译器技术,向芯片厂商提供多粒度的硬件抽象接口;芯片厂商可以根据硬件特征(无论是面向低功耗低沉本的语音芯片还是高性能高实时性的视觉芯片),快速对接到 AI 加速引擎,并高效地发挥其硬件性能。该引擎支持当前所有主流框架,几乎所有的标准模型都能够在上面一键部署;它也提供一套便捷的自定义层开发接口,方便开发者多样化需求。


面向应用开发:研发人员开发了一套标准统一的应用开发框架,同一个应用可以在不同算力的硬件上进行无缝迁移。另外,为了进一步降低使用难度,提升开发效率,平头哥集成开发环境完美融合该引擎,并添加一键部署、图形化算力分析、异构多核联合调试等功能,解决实际开发过程中最困难的问题。根据实际客户开发数据的统计,整个软件框架可为芯片厂商节省 60% 的 AI 基础软件开发成本,缩短方案厂商 50% 的应用开发时间。

无剑 SoC 平台的目标是助力芯片的差异化

据阿里巴巴称,取名无剑的目的是要以“超越常规”的方式做芯片。


无剑平台的目标并不是去做某一个具体的芯片,而是致力于把共性的基础工作做好,能够给客户提供完整的解决方案和可参考的设计,使客户做芯片时只需要针对行业的需求开发特有的内核技术。


另外,无剑平台的特点是“端云一体”、“软硬件深度融合”和“全栈集成”,通过基于共性技术开展设计,整个研发到量产的周期有望缩短 50%,通过跳过 MPW、缩短软硬件开发的人力成本,有望使得 NRE 费用降低 50%。

平头哥的“芯”战略

云端 AI 芯片含光 800,端侧处理器 IP 玄铁系列,再加上 SOC 芯片设计平台无剑,平头哥的“芯”战略展露无疑:


通过端侧的各种处理器 IP,以及芯片设计平台,降低各大芯片公司造芯的门槛;通过云端 AI 芯片,对阿里云及各企业用户进行智能化升级。

平头哥的共性技术体系:云端协同

在云侧,平头哥发布了含光 800 芯片,除此之外,平头哥还在做 MOC 相关的芯片;在端侧,平头哥更加注重生态合作,与行业合作伙伴共同开展芯片的设计,并提供玄铁处理器 IP、无剑 SoC 平台、AliOS 与基础软件以及面向领域算法提供的各种基础设施。


云和端看似两个不同的领域,从平头哥的角度看是一致的,云和端都是向行业释放算力。云侧,基于自有芯片、阿里云,提供算力;端侧,通过提供处理器 IP 与无剑平台这种面向行业的基础设施,进行相关赋能。

平头哥是“新手”?

2018 年 9 月,阿里巴巴云栖大会上,阿里巴巴 CTO 和达摩院院长张剑锋宣布成立平头哥半导体有限公司,推进云端一体化的芯片布局。这家公司由阿里此前收购的中天微系统有限公司和达摩院自研芯片业务整合而成。


虽然阿里自谦在全球芯片领域只是一个新人,但平头哥却并没有表面上仅成立一年那么简单,换句话说,如今阿里在芯片领域的成就,完全是平头哥厚积薄发的结果。


算上中天微的 19 年,以及阿里巴巴在服务器、FPGA 以及存储等硬件基础设施上早年的摸索,这些经年累月的研发经验使平头哥在体系结构、编译技术等领域拥有深厚的技术储备。

未来平头哥在芯片方面的规划

对于未来平头哥在芯片方面的规划,骄旸是这样说的:


从长远的规划上会对一些技术点深入挖掘。比如 AI 领域,虽然含光已经取得一些初步成果,但还远远不够,平头哥还有很长的路要走。


另外,关于未来芯片开发社区,将主要呈现基于平头哥基础设施的芯片产品,平头哥对芯片基础架构的统一会对软件开发产生积极的作用,而且这也会使得 IoT 开发者更加专注于行业的需求,做出有行业特色的有竞争力的产品。


总结而言,对于 IoT 芯片行业,平头哥不仅需要技术创新,同时也需要有合作模式的创新。芯片是技术性很强的行业,违背行业规律做事基本上很难成功,但除了技术还需要模式的创新。应用驱动在当前的 IoT 市场使得后来者更有优势,开放的合作是 IoT 芯片生态中必须要做的,平头哥希望未来的 IoT 芯片生态能够实现整个系统的普惠共赢。

写在后面

阿里拥有庞大的电商、金融、物流、云计算、物联网等业务,对于芯片的需求也越来越大。着力于芯片,不仅可以降低阿里整体计算的经济成本,还能以云服务的方式将更高算力、更低功耗提供给更多企业。


自去年平头哥成立以来,到现在含光 800 的正式发布流片,短短的一年时间里,平头哥便已经开始反哺阿里,为其提供芯片领域的各种支持,而平头哥的成立正是其顺应趋势的结果。


种种迹象表明,芯片、AI 与云计算三位一体的协调发展已经成为目前的主流趋势。各大公司或将根据 AI 算法设计制作芯片,通过专用 AI 芯片为云服务提供更强算力,再利用云计算加速了 AI 应用的大规模落地,进而形成了一个高效的闭环环境。


2019-10-08 15:052411
用户头像
张之栋 前InfoQ编辑

发布了 91 篇内容, 共 49.6 次阅读, 收获喜欢 159 次。

关注

评论

发布
暂无评论
发现更多内容

南开大学OpenHarmony技术俱乐部揭牌成立

科技热闻

再聊对架构决策记录的一些思考

京东科技开发者

借助 Terraform 功能协调部署 CI/CD 流水线-Part 2

SEAL安全

运维 云原生 CI/CD Terraform

华为云亮相LEAP科技展,携手沙特共创智能新高度

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟

探索大模型提示词

百度开发者中心

人工智能 自然语言处理 图像识别 大模型

GaussDB(DWS)集群通信:详解pooler连接池

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 华为云GaussDB(DWS)

探索AI的边界:如何精准地测试人工智能

霍格沃兹测试开发学社

移动App开发常见的三种模式(原生应用、H5移动应用、混合模式应用)

天津汇柏科技有限公司

软件开发 APP开发 软件定制开发

PostgreSQL数据库连接数设置的越大越好吗

张文平

数据库 postgresql 连接数 数据库配置

游戏行业需要堡垒机吗?用哪款堡垒机好?

行云管家

网络安全 游戏 数据安全 堡垒机

简单了解不同行业下4a的定义

行云管家

网络安全

AIGC 周报(3.03~3.10)

AIGC Weekly 周报

AI 互联网 周报 AIGC #人工智能

跨境电商三大趋势

api开发

掌握提示词工程与大模型多场景实战

百度开发者中心

人工智能 自动驾驶 大模型 Prompt

京东API赋能电商生态,商品详情随时掌握

技术冰糖葫芦

API 接口 API 文档 API 策略

CCE集群VPC网络模式下几种访问场景

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟

HarmonyOS-安装篇(DevEco Studio)

京东科技开发者

大模型训练中的Prompt Learning

百度开发者中心

人工智能 自然语言处理 大模型

浅谈代码架构

比伦

ios 架构

MySQL 8.0.26版本升级32版本查询数据为空的跟踪

GreatSQL

组团上车游百度,爱采购财富游学团助推中小企业开年抢跑!

科技热闻

IPQ9574/WiFi 7: Connecting everything, opening a new chapter in smart life

wallysSK

利用1688商品详情API:打造高效的电商解决方案

技术冰糖葫芦

API Explorer API 接口 API 策略 pinduoduo API

探索AI的边界:如何精准地测试人工智能

测试人

软件测试 测试开发

数据指标体系搭建方法及经验

ClkLog

现代DevOps如何改写软件开发格局

禅道项目管理

DevOps 自动化测试 项目管理软件

为了跳槽或提升自己,你会先学习哪一门编程语言?

小齐写代码

开源无代码 / 低代码平台 NocoBase 0.20:支持多数据源

NocoBase

开源 低代码 低代码开发 低代码平台 无代码平台

震惊:苹果手机电池栏“黑白无常”

京东科技开发者

以最新发布的含光800为引,看阿里在芯片领域都下了哪些“棋”_AI&大模型_张之栋_InfoQ精选文章