立即领取|华润集团、宁德核电、东风岚图等 20+ 标杆企业数字化人才培养实践案例 了解详情
写点什么

AI 芯片赛道抢跑者寒武纪:做不一样的“学术派”

  • 2019-08-20
  • 本文字数:3109 字

    阅读完需:约 10 分钟

AI芯片赛道抢跑者寒武纪:做不一样的“学术派”

中国“芯”病,由来已久。从中美贸易战开始,越来越多的人注意到这小小的芯片。芯片设计不是简单的搭建数字模拟电路,芯片的研发往往伴随着高投入、长周期的前提条件,所以这也使得更多人望而却步。


自 2017 年以来,随着 AI 大热,AI 芯片也水涨船高。迅速发展的 AI 技术要求相应的 AI 芯片具备更强的性能、更高的效率和更小的体积,也正是这一系列技术的变革,给新兴企业带来了更多的机遇和挑战。其中就包括一家初创于 2016 年的科技公司——寒武纪科技。


寒武纪科技,从遥远的“纪元”开始…

寒武纪科技,是一家设计神经处理单元 IP 核的无厂设计公司,取名“寒武纪”,以地球自然史上短时间内出现的“生命大爆发”,喻意人工智能领域即将迎来爆炸式发展。


寒武纪科技由陈天石、陈云霁两兄弟共同创立,同为“天才少年”的他们都毕业于中科大少年班;而且其他核心团队成员,如寒武纪科技副总裁刘少礼博士、刘道福博士、王在博士同样拥有着中科院的学术背景。


寒武纪科技的雏形是一个来自中科院计算技术研究所的科研团队,自 2008 年开始从事人工智能相关探索起,就取得了一系列令人瞩目的学术研究成果。


2011 年,寒武纪创始团队成员与南京大学 LAMDA 研究组合作,将人工智能方法应用于处理器架构优化,该论文发表于人工智能领域顶级国际学术会议 IJCAI 2011。


2014 年,寒武纪创始团队成员与 Inria 的国际学术合作者公开提出国际首个深度学习处理器学术架构 DianNao(电脑),该学术论文获处理器架构领域顶级国际学术会议 ASPLOS 2014 最佳论文奖。同年,他们还公开提出了国际首个多核深度学习处理器学术架构 DaDianNao(大电脑),该学术论文获处理器架构领域顶级国际学术会议 MICRO 2014 最佳论文奖(除美国以外,第一次有其他国家获得该奖项)。


2016 年,寒武纪科技正式创立,寒武纪创始团队发布国际首个智能处理器指令集 Cambricon ISA。


也许正是因为这样“硬气”的技术基础,寒武纪科技在创立没多久,就发布了成熟的商用深度学习专用处理器 IP——Cambricon-1A。华为芯片麒麟 970 发布时,不止一次提到的 NPU 就是集成了 Cambricon-1A IP。


Cambricon-1A 相对于四核的通用 CPU 来说,具有 25 倍以上的性能和 50 倍以上的能效,人工智能实测性能远超苹果 A11 处理器,搭载 Cambricon-1A 的麒麟 970 每分钟能够识别 2005 张照片,而苹果 A11 每分钟识别 889 张照片。


除此之外,在接下来的几年里,寒武纪科技陆续发布了第二代终端 IP Cambricon-1H 系列以及第三代终端 IP Cambricon-1M;在云端,寒武纪科技还发布了 MLU 系列训练推理芯片和相应的板卡产品。


层出不穷的芯片产品

从终端到云端,寒武纪科技每年都在推出新产品,以下是小编搜集到的一些信息,欢迎大家补充建议。


1.寒武纪初代 IP:Cambricon-1A


1A 是国际上首个成功商用的深度学习处理器 IP 产品,可应用于计算机视觉、语音识别、自然语言处理等智能处理关键领域。


2.寒武纪第二代低功耗版 IP:Cambricon-1H8、Cambricon-1H16


1H 系列面向视觉应用,是专为机器视觉应用设计的终端智能 IP 产品,可应用于计算机视觉等领域,提升视觉终端人、车、物、行为、图像、视频等的抓取和即时处理能力。


3.寒武纪第三代高性能版 IP:Cambricon-1M


在 7nm 工艺下,1M 能够实现 5TOPS/W 能效比,支持个性化深度学习,适用于多路视频实时处理,主要面向智能驾驶领域。


4.寒武纪初代云端芯片:Cambricon-MLU100


MLU100 云端智能芯片采用 MLUv01 指令集(自主研发);等效理论计算能力高达 128TOPS, 支持 4 通道 64bit ECC ;主要用于云端推理场景。


5.寒武纪第二代云端芯片:Cambricon-MLU270(思元 270)


MLU270 云端智能芯片采用 MLUv02 指令集(自主研发),处理非稀疏深度学习模型的理论峰值性能提升至上一代 MLU100 的 4 倍,达到 128TOPS(INT8);同时兼容 INT4 和 INT16 运算,理论峰值分别达到 256TOPS 和 64TOPS;支持浮点运算和混合精度运算。


支持视觉、语音、自然语言处理以及传统机器学习等人工智能应用,还为视觉应用集成了视频和图像编解码硬件单元。


据称,寒武纪科技在定点训练领域已实现关键性突破,思元 270 训练版板卡可通过 8 位或 16 位定点运算提供人工智能训练性能,该技术有望成为 AI 芯片发展的重要里程碑。


6.软件开发环境:Cambricon-NeuWare


寒武纪为开发者发布了一套开发环境——Cambricon-NeuWare,其包括应用开发、功能调试、性能调优等在内的一系列工具。


他们这样“玩转”AI 芯片

在去年InfoQ与寒武纪科技的首次接触中,副总裁王在告诉我们:“做企业会面临各种各样的困难,比如人才引进、国际巨头的围剿等等。”有问题就要解决,作为仅有“3 岁”的初创公司,寒武纪科技选择了一种“最靠谱也最难”的方法——持续保持技术上的领先性。


王在说:“在芯片设计这一环节,寒武纪现在非常有幸能够处于一个世界引领的位置。工业上我们不敢这么自大,但是从研发的学术领域以及前沿性上来讲,我们是处于世界上的绝对引领这样一个地位的,国家也对我们寄予厚望,认为这也是一个在未来到来的时候能够跟外国人平起平坐的一个点,甚至能够超越他们。”


目前,寒武纪科技有两条产品线——终端的 IP 授权和云端的服务器芯片。


在终端,以 IP 授权的形式集成于智能手机、智能摄像头等终端的 SoC 芯片中;在云端,以板卡形式面向云数据中心服务器集群,提供智能计算加速功能,是面向深度学习、机器学习的智能处理器,适用于云端推理+训练应用。


  • Cambricon-1A 于 2016 年 3 月推出,应用于 2017 年 9 月华为麒麟 970 芯片

  • Cambricon-1H8、Cambricon-1H16 于 2017 年 11 月推出,应用于 2018 年 8 月华为麒麟 980 芯片

  • Cambricon-1M 于 2017 年 11 月推出

  • Cambricon-MLU100 及相应板卡产品于 2018 年 5 月推出,联想同步发布了国内首款搭载寒武纪 MLU100 智能处理卡的服务器平台——ThinkSystem SR650,曙光和科大讯飞也发布了基于寒武纪芯片的应用产品;2019 年 8 月金山云新一代云物理机 CMLU1 同样搭载 MLU100 智能处理卡

  • Cambricon-MLU270(思元 270)及相应板卡产品于 2019 年 6 月推出,思元 270 训练版板卡预计将于今年第四季度投入生产。


总的来说,在过去的几年里,寒武纪科技证明了自己在技术方面的实力。但就目前而言,或许寒武纪科技对于终端客户的开拓并不足够,虽然寒武纪官方表示已经有不少客户正在考虑或已经引入其架构,但时至今日,人们并没有看到更多实际进展。

写在后面

为加快布局 AI 芯片领域,减少对国外芯片的依赖,寒武纪、华为等中国公司不断发力,以应对变幻莫测的 AI 芯片市场。


那么,寒武纪科技是不是成功的?我想答案是肯定的,即使现在的它正面临着巨大的挑战。


Google、Facebook 等巨头想在中国 AI 业务商用上分一块蛋糕,在他们的推动下,市场上也充斥着各式各样来自国外的 AI 芯片架构,这些问题的出现无疑给寒武纪科技带来了不小的冲击。


另外,作为寒武纪科技终端 IP 受用者的华为,一直是寒武纪科技的合作伙伴,然而随着华为海思自研 AI 芯片提上日程,并发布成熟产品麒麟 810 芯片之后,“关系破裂”的两家公司仿佛走到了彼此的对立面,竞争也在所难免。


据了解,目前 AI 芯片领域中,算法、框架以及整套开发工具所占据的比重越来越大。如果没有办法展现出自己的开发体系更具优势,专注于发展 AI 通用计算硬件平台的寒武纪科技,又该怎样改变现有的 AI 计算生态呢?


寒武纪科技作为新创企业,仅仅依靠两三年的发展,客户基础方面想必是有所欠缺的,而且就目前形势来看,一种足够稳定的获利模式,以及一个足够稳定的生态对于寒武纪科技来说显得尤为重要。


随着今年世界人工智能大会的日益临近,寒武纪科技又将如何凭借这个舞台提升自己的市场“可见度”,寻找更多强有力的合作伙伴呢?让我们一起拭目以待。


2019-08-20 08:007733
用户头像
张之栋 前InfoQ编辑

发布了 91 篇内容, 共 49.0 次阅读, 收获喜欢 159 次。

关注

评论

发布
暂无评论
发现更多内容

飞桨框架3.0核心升级:动静统一自动并行,轻松开发大模型

百度Geek说

百度 百度飞桨 #大模型

深入京东API世界:商品详情返回值的秘密

技术冰糖葫芦

API Explorer API 测试 API 策略 pinduoduo API

深入解析淘宝商品详情API返回值中的商品材质与成分

代码忍者

API 测试 API 策略

智能终端密码模块的三重防护

芯盾时代

信息安全 终端安全 密码

阿里PAI-ChatLearn:大规模 Alignment高效训练框架正式开源

阿里云大数据AI技术

人工智能 开源 LLM Alignment PAI-ChatLearn

Microsoft PowerPoint LTSC 2021 for Mac( ppt 2021)办公软件中文版

Mac相关知识分享

办公软件 mac软件下载

云桌面如何深度解决传统办公场景应用难题?

上海锐起科技

在AI最火热的时候,AI大牛写了本小说

博文视点Broadview

跨平台.NET IDE 集成开发环境JetBrains Rider 2024 for Mac

Mac相关知识分享

集成开发环境 mac软件开发

基于LangChain手工测试用例转Web自动化测试生成工具

测试人

人工智能 软件测试 测试用例

新兴产业怎么定义?需要堡垒机有什么用?

行云管家

网络安全 堡垒机 新兴产业

京东商品信息高效抓取:利用API实现数据获取的实战指南

代码忍者

API 测试 API 策略

LED广告屏深受欢迎的原因分析

Dylan

广告 科技 LED display LED显示屏 零售电商市场

阐述(中心/去中心)交易所系统开发技术理念丨源码搭建丨技术分享

V\TG【ch3nguang】

《全民养猪》模式系统开发搭建/规范设计

V\TG【ch3nguang】

核心技术揭秘:AI、低代码与定制开发的三重奏,如何应对复杂业务需求

天津汇柏科技有限公司

低代码平台 软件开发定制 AI 人工智能

JDBC类型解析

JDBC count(1) jdbc类型处理

OpenAI“草莓项目”最快今年秋季发布!苹果将于9月10号推出首款AI iPhone|AI日报

可信AI进展

浅谈大模型生成类应用的需求分析设计与实践

鲸品堂

文档 大模型 生成式 企业号2024年8月PK榜

《悠然垂钓记》模拟垂钓游戏模式开发步骤实行

V\TG【ch3nguang】

如何利用 StarRocks 实时分析数据湖中的数据?

镜舟科技

StarRocks 湖仓一体 大数据 开源

mac远程工具推荐:Microsoft Remote Desktop for Mac 特别版

你的猪会飞吗

Mac软件 mac软件下载 mac破解

996/007:背后的真相

老张

职场成长 996 007 认知 加班文化

邮件管理软件Microsoft Outlook 2021 LTSC for Mac

Mac相关知识分享

微软 办公软件

TimeWheel 算法介绍及在应用上的探索

vivo互联网技术

dubbo TimeWheel 时间轮模型

MySQL 延迟从库介绍

Simon

MySQL MySQL主从复制

火山引擎数智平台:A/B测试个性化配置能力发布,拓展多场景策略最优解

字节跳动数据平台

大数据 A/B测试 对比实验 数字化增长

唐山等保测评机构有吗?在哪里?

行云管家

等保 等级保护 唐山

数业智能心大陆开学 “收心” 全指南

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

家装辅助设计软件Sweet Home 3D for Mac

Mac相关知识分享

室内家居设计软件 室内设计软件

Mac 的云盘本地加载工具CloudMounter mac

Mac相关知识分享

云盘本地加载工具

AI芯片赛道抢跑者寒武纪:做不一样的“学术派”_AICon_张之栋_InfoQ精选文章