AI芯片赛道抢跑者寒武纪：做不一样的“学术派”_AICon_张之栋

立即领取｜华润集团、宁德核电、东风岚图等 20+ 标杆企业数字化人才培养实践案例了解详情 



 写点什么

中国“芯”病，由来已久。从中美贸易战开始，越来越多的人注意到这小小的芯片。芯片设计不是简单的搭建数字模拟电路，芯片的研发往往伴随着高投入、长周期的前提条件，所以这也使得更多人望而却步。

自 2017 年以来，随着 AI 大热，AI 芯片也水涨船高。迅速发展的 AI 技术要求相应的 AI 芯片具备更强的性能、更高的效率和更小的体积，也正是这一系列技术的变革，给新兴企业带来了更多的机遇和挑战。其中就包括一家初创于 2016 年的科技公司——寒武纪科技。

寒武纪科技，从遥远的“纪元”开始…

寒武纪科技，是一家设计神经处理单元 IP 核的无厂设计公司，取名“寒武纪”，以地球自然史上短时间内出现的“生命大爆发”，喻意人工智能领域即将迎来爆炸式发展。

寒武纪科技由陈天石、陈云霁两兄弟共同创立，同为“天才少年”的他们都毕业于中科大少年班；而且其他核心团队成员，如寒武纪科技副总裁刘少礼博士、刘道福博士、王在博士同样拥有着中科院的学术背景。

寒武纪科技的雏形是一个来自中科院计算技术研究所的科研团队，自 2008 年开始从事人工智能相关探索起，就取得了一系列令人瞩目的学术研究成果。

2011 年，寒武纪创始团队成员与南京大学 LAMDA 研究组合作，将人工智能方法应用于处理器架构优化，该论文发表于人工智能领域顶级国际学术会议 IJCAI 2011。

2014 年，寒武纪创始团队成员与 Inria 的国际学术合作者公开提出国际首个深度学习处理器学术架构 DianNao（电脑），该学术论文获处理器架构领域顶级国际学术会议 ASPLOS 2014 最佳论文奖。同年，他们还公开提出了国际首个多核深度学习处理器学术架构 DaDianNao（大电脑），该学术论文获处理器架构领域顶级国际学术会议 MICRO 2014 最佳论文奖（除美国以外，第一次有其他国家获得该奖项）。

2016 年，寒武纪科技正式创立，寒武纪创始团队发布国际首个智能处理器指令集 Cambricon ISA。

也许正是因为这样“硬气”的技术基础，寒武纪科技在创立没多久，就发布了成熟的商用深度学习专用处理器 IP——Cambricon-1A。华为芯片麒麟 970 发布时，不止一次提到的 NPU 就是集成了 Cambricon-1A IP。

Cambricon-1A 相对于四核的通用 CPU 来说，具有 25 倍以上的性能和 50 倍以上的能效，人工智能实测性能远超苹果 A11 处理器，搭载 Cambricon-1A 的麒麟 970 每分钟能够识别 2005 张照片，而苹果 A11 每分钟识别 889 张照片。

除此之外，在接下来的几年里，寒武纪科技陆续发布了第二代终端 IP Cambricon-1H 系列以及第三代终端 IP Cambricon-1M；在云端，寒武纪科技还发布了 MLU 系列训练推理芯片和相应的板卡产品。

层出不穷的芯片产品

从终端到云端，寒武纪科技每年都在推出新产品，以下是小编搜集到的一些信息，欢迎大家补充建议。

1.寒武纪初代 IP：Cambricon-1A

1A 是国际上首个成功商用的深度学习处理器 IP 产品，可应用于计算机视觉、语音识别、自然语言处理等智能处理关键领域。

2.寒武纪第二代低功耗版 IP：Cambricon-1H8、Cambricon-1H16

1H 系列面向视觉应用，是专为机器视觉应用设计的终端智能 IP 产品，可应用于计算机视觉等领域，提升视觉终端人、车、物、行为、图像、视频等的抓取和即时处理能力。

3.寒武纪第三代高性能版 IP：Cambricon-1M

在 7nm 工艺下，1M 能够实现 5TOPS/W 能效比，支持个性化深度学习，适用于多路视频实时处理，主要面向智能驾驶领域。

4.寒武纪初代云端芯片：Cambricon-MLU100

MLU100 云端智能芯片采用 MLUv01 指令集（自主研发）；等效理论计算能力高达 128TOPS，支持 4 通道 64bit ECC ；主要用于云端推理场景。

5.寒武纪第二代云端芯片：Cambricon-MLU270（思元 270）

MLU270 云端智能芯片采用 MLUv02 指令集（自主研发），处理非稀疏深度学习模型的理论峰值性能提升至上一代 MLU100 的 4 倍，达到 128TOPS（INT8）；同时兼容 INT4 和 INT16 运算，理论峰值分别达到 256TOPS 和 64TOPS；支持浮点运算和混合精度运算。

支持视觉、语音、自然语言处理以及传统机器学习等人工智能应用，还为视觉应用集成了视频和图像编解码硬件单元。

据称，寒武纪科技在定点训练领域已实现关键性突破，思元 270 训练版板卡可通过 8 位或 16 位定点运算提供人工智能训练性能，该技术有望成为 AI 芯片发展的重要里程碑。

6.软件开发环境：Cambricon-NeuWare

寒武纪为开发者发布了一套开发环境——Cambricon-NeuWare，其包括应用开发、功能调试、性能调优等在内的一系列工具。

他们这样“玩转”AI 芯片

在去年InfoQ与寒武纪科技的首次接触中，副总裁王在告诉我们：“做企业会面临各种各样的困难，比如人才引进、国际巨头的围剿等等。”有问题就要解决，作为仅有“3 岁”的初创公司，寒武纪科技选择了一种“最靠谱也最难”的方法——持续保持技术上的领先性。

王在说：“在芯片设计这一环节，寒武纪现在非常有幸能够处于一个世界引领的位置。工业上我们不敢这么自大，但是从研发的学术领域以及前沿性上来讲，我们是处于世界上的绝对引领这样一个地位的，国家也对我们寄予厚望，认为这也是一个在未来到来的时候能够跟外国人平起平坐的一个点，甚至能够超越他们。”

目前，寒武纪科技有两条产品线——终端的 IP 授权和云端的服务器芯片。

在终端，以 IP 授权的形式集成于智能手机、智能摄像头等终端的 SoC 芯片中；在云端，以板卡形式面向云数据中心服务器集群，提供智能计算加速功能，是面向深度学习、机器学习的智能处理器，适用于云端推理+训练应用。

Cambricon-1A 于 2016 年 3 月推出，应用于 2017 年 9 月华为麒麟 970 芯片
Cambricon-1H8、Cambricon-1H16 于 2017 年 11 月推出，应用于 2018 年 8 月华为麒麟 980 芯片
Cambricon-1M 于 2017 年 11 月推出
Cambricon-MLU100 及相应板卡产品于 2018 年 5 月推出，联想同步发布了国内首款搭载寒武纪 MLU100 智能处理卡的服务器平台——ThinkSystem SR650，曙光和科大讯飞也发布了基于寒武纪芯片的应用产品；2019 年 8 月金山云新一代云物理机 CMLU1 同样搭载 MLU100 智能处理卡
Cambricon-MLU270（思元 270）及相应板卡产品于 2019 年 6 月推出，思元 270 训练版板卡预计将于今年第四季度投入生产。

总的来说，在过去的几年里，寒武纪科技证明了自己在技术方面的实力。但就目前而言，或许寒武纪科技对于终端客户的开拓并不足够，虽然寒武纪官方表示已经有不少客户正在考虑或已经引入其架构，但时至今日，人们并没有看到更多实际进展。

写在后面

为加快布局 AI 芯片领域，减少对国外芯片的依赖，寒武纪、华为等中国公司不断发力，以应对变幻莫测的 AI 芯片市场。

那么，寒武纪科技是不是成功的？我想答案是肯定的，即使现在的它正面临着巨大的挑战。

Google、Facebook 等巨头想在中国 AI 业务商用上分一块蛋糕，在他们的推动下，市场上也充斥着各式各样来自国外的 AI 芯片架构，这些问题的出现无疑给寒武纪科技带来了不小的冲击。

另外，作为寒武纪科技终端 IP 受用者的华为，一直是寒武纪科技的合作伙伴，然而随着华为海思自研 AI 芯片提上日程，并发布成熟产品麒麟 810 芯片之后，“关系破裂”的两家公司仿佛走到了彼此的对立面，竞争也在所难免。

据了解，目前 AI 芯片领域中，算法、框架以及整套开发工具所占据的比重越来越大。如果没有办法展现出自己的开发体系更具优势，专注于发展 AI 通用计算硬件平台的寒武纪科技，又该怎样改变现有的 AI 计算生态呢？

寒武纪科技作为新创企业，仅仅依靠两三年的发展，客户基础方面想必是有所欠缺的，而且就目前形势来看，一种足够稳定的获利模式，以及一个足够稳定的生态对于寒武纪科技来说显得尤为重要。

随着今年世界人工智能大会的日益临近，寒武纪科技又将如何凭借这个舞台提升自己的市场“可见度”，寻找更多强有力的合作伙伴呢？让我们一起拭目以待。

发布

暂无评论

创作场景

AI 芯片赛道抢跑者寒武纪：做不一样的“学术派”

寒武纪科技，从遥远的“纪元”开始…

层出不穷的芯片产品

他们这样“玩转”AI 芯片

写在后面

评论

飞桨框架3.0核心升级：动静统一自动并行，轻松开发大模型

深入京东API世界：商品详情返回值的秘密

深入解析淘宝商品详情API返回值中的商品材质与成分

智能终端密码模块的三重防护

阿里PAI-ChatLearn：大规模 Alignment高效训练框架正式开源

Microsoft PowerPoint LTSC 2021 for Mac( ppt 2021)办公软件中文版

云桌面如何深度解决传统办公场景应用难题？

在AI最火热的时候，AI大牛写了本小说

跨平台.NET IDE 集成开发环境JetBrains Rider 2024 for Mac

基于LangChain手工测试用例转Web自动化测试生成工具

新兴产业怎么定义？需要堡垒机有什么用？

京东商品信息高效抓取：利用API实现数据获取的实战指南

LED广告屏深受欢迎的原因分析

阐述（中心/去中心）交易所系统开发技术理念丨源码搭建丨技术分享

《全民养猪》模式系统开发搭建/规范设计

核心技术揭秘：AI、低代码与定制开发的三重奏，如何应对复杂业务需求

JDBC类型解析

OpenAI“草莓项目”最快今年秋季发布！苹果将于9月10号推出首款AI iPhone｜AI日报

浅谈大模型生成类应用的需求分析设计与实践

《悠然垂钓记》模拟垂钓游戏模式开发步骤实行

如何利用 StarRocks 实时分析数据湖中的数据？

mac远程工具推荐：Microsoft Remote Desktop for Mac 特别版

996/007：背后的真相

邮件管理软件Microsoft Outlook 2021 LTSC for Mac

TimeWheel 算法介绍及在应用上的探索

MySQL 延迟从库介绍

火山引擎数智平台：A/B测试个性化配置能力发布，拓展多场景策略最优解

唐山等保测评机构有吗？在哪里？

数业智能心大陆开学 “收心” 全指南

家装辅助设计软件Sweet Home 3D for Mac

Mac 的云盘本地加载工具CloudMounter mac

创作场景

AI 芯片赛道抢跑者寒武纪：做不一样的“学术派”

寒武纪科技，从遥远的“纪元”开始…

层出不穷的芯片产品

他们这样“玩转”AI 芯片

写在后面

评论

更多内容推荐

推荐阅读

电子书