12 月 11 日,AI 芯片创企燧原科技在上海举办首场发布会。此次发布会上,燧原科技推出了首款云端 AI 训练芯片邃思 DTU,以及搭载该芯片的 AI 加速卡云燧 T10。据燧原科技表示,云燧 T10 已经可以实现量产,并预计 2020 年第一季度上市。至此,这家由腾讯投资,且成立至今不到两年的“年轻”公司,迈进了 AI 芯片市场的竞争赛道。
邃思 DTU 集成有 141 亿晶体管
邃思DTU 是本次燧原科技发布会的主角,将主要应用于云端人工智能训练,支持 CNN、RNN、LSTM、BERT 等网络模型以及 FP32、FP16、BF16、Int8、Int16、Int32 等数据类型。
邃思 DTU 基于通用 AI 处理器的设计,具备一定的可编程性,其计算核心拥有 32 个通用独立自主设计的可扩展神经元处理器(SIP),每 8 个 SIP 可以组合成 1 个可扩展智能计算群(SIC)。
据燧原科技介绍,邃思 DTU 由 12nm FinFET 工艺打造,集成了 141 亿个晶体管,采用 2.5D 封装,具有 16Gbps 的 PCIe 4.0 接口和 25Gbps 的 ESL 高速互联。
云燧 T10 性能超英伟达 V100
云燧T10 和云燧 T11 是此次发布会的另一亮点,而且燧原科技表示,云燧 T10 已经可以实现量产,预计 2020 年第一季度上市。
据了解,云燧 T10 是一款面向云端数据中心的 AI 训练加速卡,双槽位标卡,支持 PCIe 4.0。单卡单精度(FP32)算力可达 20TFLOPS,支持单精度 FP32 和半精度 BF16 的混合精度计算,最大功耗 225W,这与英伟达最新Tesla V100S单精度算力 16.4TFLOPS、最大功耗 250W~300W 相比,具有性能上的优越性。
生态开放:驭算平台支持主流深度学习框架
在发布会上,燧思科技同时推出了编程平台“驭算”,它在支持主流深度学习框架如 TensorFlow、PyTorch 等框架的同时,还针对邃思芯片做了特定优化。驭算可以提供完整的编译、调试、调优工具链,并且在硬件层开放了 SDK,为深度开发者提供细粒度算力编程接口,降低了开发门槛。
据了解,驭算可以针对复杂模型集群训练,如 BERT 等,提供分布式调度系统,并在 1024 节点集群规模下,训练线性度加速比达到 86%。
BAT 对云端 AI 芯片的押注
燧原科技 CEO 赵立东,在此次发布会上表示,“目前我们已经与腾讯针对通用人工智能应用场景的项目开展密切的合作,未来也将会扩展到更多 AI 应用场景。”
从这里或许就不难看出,BAT 三巨头,对于云端 AI 芯片的押注开始初露端倪。
腾讯对燧原科技的投资,得到了燧思 DTU 的加成,百度昆仑和阿里含光800在前些日子也是出了不小的风头,尤其是这些 AI 芯片的应用场景同为云端加速,不得不让人去联想,BAT 是否开始选择了同一条路:通过对 AI 芯片的押注,重点推动自家的云计算战略。
随着 5G 时代的到来,云端也变得更加重要,当传输足够快速,无论是训练和推理,或许都可以放在云端进行,而 AI 芯片的存在,无疑是为云端应用提供了强大助力,至少除了 BAT 三大巨头之外,华为(昇腾系列芯片)、谷歌(TPU)、AWS(第二代自研云端芯片)、微软(Graphcore IPU 商业化)等也早已开始行动。
公司介绍:
燧原科技,2018 年 3 月成立于上海,由赵立东和张亚林联合创立,成立距今不足两年。据了解,燧原科技研发团队的主要成员拥有着 15 年以上的芯片及相关软件生态系统的开发及量产经验,其中燧原科技 CEO 赵立东曾在 AMD、紫光任职,燧原科技 COO 张亚林也有在 AMD 近十年的工作经历。
评论