写点什么

AI 芯片赛道抢跑者寒武纪:做不一样的“学术派”

  • 2019-08-20
  • 本文字数:3109 字

    阅读完需:约 10 分钟

AI芯片赛道抢跑者寒武纪:做不一样的“学术派”

中国“芯”病,由来已久。从中美贸易战开始,越来越多的人注意到这小小的芯片。芯片设计不是简单的搭建数字模拟电路,芯片的研发往往伴随着高投入、长周期的前提条件,所以这也使得更多人望而却步。


自 2017 年以来,随着 AI 大热,AI 芯片也水涨船高。迅速发展的 AI 技术要求相应的 AI 芯片具备更强的性能、更高的效率和更小的体积,也正是这一系列技术的变革,给新兴企业带来了更多的机遇和挑战。其中就包括一家初创于 2016 年的科技公司——寒武纪科技。


寒武纪科技,从遥远的“纪元”开始…

寒武纪科技,是一家设计神经处理单元 IP 核的无厂设计公司,取名“寒武纪”,以地球自然史上短时间内出现的“生命大爆发”,喻意人工智能领域即将迎来爆炸式发展。


寒武纪科技由陈天石、陈云霁两兄弟共同创立,同为“天才少年”的他们都毕业于中科大少年班;而且其他核心团队成员,如寒武纪科技副总裁刘少礼博士、刘道福博士、王在博士同样拥有着中科院的学术背景。


寒武纪科技的雏形是一个来自中科院计算技术研究所的科研团队,自 2008 年开始从事人工智能相关探索起,就取得了一系列令人瞩目的学术研究成果。


2011 年,寒武纪创始团队成员与南京大学 LAMDA 研究组合作,将人工智能方法应用于处理器架构优化,该论文发表于人工智能领域顶级国际学术会议 IJCAI 2011。


2014 年,寒武纪创始团队成员与 Inria 的国际学术合作者公开提出国际首个深度学习处理器学术架构 DianNao(电脑),该学术论文获处理器架构领域顶级国际学术会议 ASPLOS 2014 最佳论文奖。同年,他们还公开提出了国际首个多核深度学习处理器学术架构 DaDianNao(大电脑),该学术论文获处理器架构领域顶级国际学术会议 MICRO 2014 最佳论文奖(除美国以外,第一次有其他国家获得该奖项)。


2016 年,寒武纪科技正式创立,寒武纪创始团队发布国际首个智能处理器指令集 Cambricon ISA。


也许正是因为这样“硬气”的技术基础,寒武纪科技在创立没多久,就发布了成熟的商用深度学习专用处理器 IP——Cambricon-1A。华为芯片麒麟 970 发布时,不止一次提到的 NPU 就是集成了 Cambricon-1A IP。


Cambricon-1A 相对于四核的通用 CPU 来说,具有 25 倍以上的性能和 50 倍以上的能效,人工智能实测性能远超苹果 A11 处理器,搭载 Cambricon-1A 的麒麟 970 每分钟能够识别 2005 张照片,而苹果 A11 每分钟识别 889 张照片。


除此之外,在接下来的几年里,寒武纪科技陆续发布了第二代终端 IP Cambricon-1H 系列以及第三代终端 IP Cambricon-1M;在云端,寒武纪科技还发布了 MLU 系列训练推理芯片和相应的板卡产品。


层出不穷的芯片产品

从终端到云端,寒武纪科技每年都在推出新产品,以下是小编搜集到的一些信息,欢迎大家补充建议。


1.寒武纪初代 IP:Cambricon-1A


1A 是国际上首个成功商用的深度学习处理器 IP 产品,可应用于计算机视觉、语音识别、自然语言处理等智能处理关键领域。


2.寒武纪第二代低功耗版 IP:Cambricon-1H8、Cambricon-1H16


1H 系列面向视觉应用,是专为机器视觉应用设计的终端智能 IP 产品,可应用于计算机视觉等领域,提升视觉终端人、车、物、行为、图像、视频等的抓取和即时处理能力。


3.寒武纪第三代高性能版 IP:Cambricon-1M


在 7nm 工艺下,1M 能够实现 5TOPS/W 能效比,支持个性化深度学习,适用于多路视频实时处理,主要面向智能驾驶领域。


4.寒武纪初代云端芯片:Cambricon-MLU100


MLU100 云端智能芯片采用 MLUv01 指令集(自主研发);等效理论计算能力高达 128TOPS, 支持 4 通道 64bit ECC ;主要用于云端推理场景。


5.寒武纪第二代云端芯片:Cambricon-MLU270(思元 270)


MLU270 云端智能芯片采用 MLUv02 指令集(自主研发),处理非稀疏深度学习模型的理论峰值性能提升至上一代 MLU100 的 4 倍,达到 128TOPS(INT8);同时兼容 INT4 和 INT16 运算,理论峰值分别达到 256TOPS 和 64TOPS;支持浮点运算和混合精度运算。


支持视觉、语音、自然语言处理以及传统机器学习等人工智能应用,还为视觉应用集成了视频和图像编解码硬件单元。


据称,寒武纪科技在定点训练领域已实现关键性突破,思元 270 训练版板卡可通过 8 位或 16 位定点运算提供人工智能训练性能,该技术有望成为 AI 芯片发展的重要里程碑。


6.软件开发环境:Cambricon-NeuWare


寒武纪为开发者发布了一套开发环境——Cambricon-NeuWare,其包括应用开发、功能调试、性能调优等在内的一系列工具。


他们这样“玩转”AI 芯片

在去年InfoQ与寒武纪科技的首次接触中,副总裁王在告诉我们:“做企业会面临各种各样的困难,比如人才引进、国际巨头的围剿等等。”有问题就要解决,作为仅有“3 岁”的初创公司,寒武纪科技选择了一种“最靠谱也最难”的方法——持续保持技术上的领先性。


王在说:“在芯片设计这一环节,寒武纪现在非常有幸能够处于一个世界引领的位置。工业上我们不敢这么自大,但是从研发的学术领域以及前沿性上来讲,我们是处于世界上的绝对引领这样一个地位的,国家也对我们寄予厚望,认为这也是一个在未来到来的时候能够跟外国人平起平坐的一个点,甚至能够超越他们。”


目前,寒武纪科技有两条产品线——终端的 IP 授权和云端的服务器芯片。


在终端,以 IP 授权的形式集成于智能手机、智能摄像头等终端的 SoC 芯片中;在云端,以板卡形式面向云数据中心服务器集群,提供智能计算加速功能,是面向深度学习、机器学习的智能处理器,适用于云端推理+训练应用。


  • Cambricon-1A 于 2016 年 3 月推出,应用于 2017 年 9 月华为麒麟 970 芯片

  • Cambricon-1H8、Cambricon-1H16 于 2017 年 11 月推出,应用于 2018 年 8 月华为麒麟 980 芯片

  • Cambricon-1M 于 2017 年 11 月推出

  • Cambricon-MLU100 及相应板卡产品于 2018 年 5 月推出,联想同步发布了国内首款搭载寒武纪 MLU100 智能处理卡的服务器平台——ThinkSystem SR650,曙光和科大讯飞也发布了基于寒武纪芯片的应用产品;2019 年 8 月金山云新一代云物理机 CMLU1 同样搭载 MLU100 智能处理卡

  • Cambricon-MLU270(思元 270)及相应板卡产品于 2019 年 6 月推出,思元 270 训练版板卡预计将于今年第四季度投入生产。


总的来说,在过去的几年里,寒武纪科技证明了自己在技术方面的实力。但就目前而言,或许寒武纪科技对于终端客户的开拓并不足够,虽然寒武纪官方表示已经有不少客户正在考虑或已经引入其架构,但时至今日,人们并没有看到更多实际进展。

写在后面

为加快布局 AI 芯片领域,减少对国外芯片的依赖,寒武纪、华为等中国公司不断发力,以应对变幻莫测的 AI 芯片市场。


那么,寒武纪科技是不是成功的?我想答案是肯定的,即使现在的它正面临着巨大的挑战。


Google、Facebook 等巨头想在中国 AI 业务商用上分一块蛋糕,在他们的推动下,市场上也充斥着各式各样来自国外的 AI 芯片架构,这些问题的出现无疑给寒武纪科技带来了不小的冲击。


另外,作为寒武纪科技终端 IP 受用者的华为,一直是寒武纪科技的合作伙伴,然而随着华为海思自研 AI 芯片提上日程,并发布成熟产品麒麟 810 芯片之后,“关系破裂”的两家公司仿佛走到了彼此的对立面,竞争也在所难免。


据了解,目前 AI 芯片领域中,算法、框架以及整套开发工具所占据的比重越来越大。如果没有办法展现出自己的开发体系更具优势,专注于发展 AI 通用计算硬件平台的寒武纪科技,又该怎样改变现有的 AI 计算生态呢?


寒武纪科技作为新创企业,仅仅依靠两三年的发展,客户基础方面想必是有所欠缺的,而且就目前形势来看,一种足够稳定的获利模式,以及一个足够稳定的生态对于寒武纪科技来说显得尤为重要。


随着今年世界人工智能大会的日益临近,寒武纪科技又将如何凭借这个舞台提升自己的市场“可见度”,寻找更多强有力的合作伙伴呢?让我们一起拭目以待。


2019-08-20 08:007727
用户头像
张之栋 前InfoQ编辑

发布了 91 篇内容, 共 48.8 次阅读, 收获喜欢 159 次。

关注

评论

发布
暂无评论
发现更多内容

面向物联网的 NGINX Plus:对 MQTT 流量进行加密和身份验证

NGINX开源社区

负载均衡 开源 物联网 IoT mqtt

智源发布三款BGE新模型,再次刷新向量检索最佳水平

智源研究院

再获奖项,亚信安慧AntDB数据库被评为“2023-2024国产数据库创新赋能优秀产品”

亚信AntDB数据库

利用人工智能ChatGPT自动生成基于PO的数据驱动测试框架

测试人

软件测试

7thonline第七在线出席中服协时尚科技峰会 探讨AI商品管理落地

第七在线

macOS Ventura 13.6.8 (22G820) 正式版发布,ISO、IPSW、PKG 下载

sysin

macos ISO ventura

大咖公开课 | 大模型场景讲解以及测试方法

测试人

软件测试

【YashanDB知识库】ycm纳管主机安装YCM-AGENT时报错“任务提交失败,无法连接主机”

YashanDB

yashandb 崖山数据库 崖山DB

【YashanDB知识库】ycm托管数据库时,数据库非OM安装无法托管

YashanDB

yashandb 崖山数据库 崖山DB

wamp配置多目录访问方法

tbapi

wamp

如何挑选最佳个人项目管理工具:专家建议

爱吃小舅的鱼

项目管理

【YashanDB知识库】自动选举配置错误引发的一系列问题

YashanDB

yashandb 崖山数据库 崖山DB

硅纪元视角 | 6秒生成4张图,Getty Images和英伟达联合推出文生图AI模型

硅纪元

【YashanDB知识库】账号被锁,如何分析具体原因

YashanDB

yashandb 崖山数据库 崖山DB

AI技术修复奥运珍贵历史影像,《永不失色的她》再现百年奥运女性光彩

阿里云视频云

云计算 音视频 AI技术 视频云 奥运会

新版HAP应用市场即将推出,诚邀意向开发者提前入驻,抢占先机

明道云

【Hbase】运维问题汇总

扬_帆_起_航

全渠道AI数字化商品管理 零售品牌增长“超级引擎”

第七在线

利用人工智能ChatGPT自动生成基于PO的数据驱动测试框架

霍格沃兹测试开发学社

济宁有正规等保测评机构吗?大神求告知!

行云管家

等保 等级保护 济宁

macOS Monterey 12.7.6 (21H1320) 正式版发布,ISO、IPSW、PKG 下载

sysin

macos ISO ventura

【YashanDB知识库】IMP跨网络导入慢问题

YashanDB

yashandb 崖山数据库 崖山DB

IPQ9570 with QCN6274 in a 4x4 Wi-Fi 7 Configuration Exploring the Performance and Technical Benefits

wifi6-yiyi

wifi

利用人工智能ChatGPT自动生成基于PO的数据驱动测试框架

测吧(北京)科技有限公司

测试

优化数据处理效率,解读 EasyMR 大数据组件升级

袋鼠云数栈

大数据组件 大数据计算引擎 大数据引擎 数据组件 组件升级

百度智能云 ABC Stack 获可信云技术最佳实践,共建一云多算生态

Baidu AICLOUD

穿越流程管理的丛林!Prothentic学院「流程管理培训」第1期圆满落幕

望繁信科技

业务流程管理 望繁信科技 流程管理培训 陈果George Prothentic学院

闲鱼开发者必读:如何利用闲鱼商品列表数据接口进行数据分析

tbapi

闲鱼API 闲鱼商品列表接口 闲鱼商品列表数据接口 闲鱼商品列表数据采集

生成式 AI 时代的数据库:Databend 与大模型的融合探索

Databend

Go 并发编程原语及并发设计模式

baiyutang

Go 编程 云原生 并发’

AI芯片赛道抢跑者寒武纪:做不一样的“学术派”_AICon_张之栋_InfoQ精选文章