特斯拉披露自家超算集群雏形，最新版本超算有望登顶世界第一？

特斯拉选择的是纯视觉的自动驾驶方案，这种方案对传感器的依赖较弱，但需要极强的数据处理和 AI 能力，这就使得自研适应性强的超级计算机显得很有必要。

随着自动驾驶的不断成熟，自动驾驶汽车公司对算力的需求正在呈指数级增长。在 2021 年计算机视觉和模式识别会议 (CVPR 2021) 上，特斯拉特斯拉人工智能与自动驾驶视觉总监（Director of AI and Autopilot Vision） Andrej Karpathy 公布了自家的第三个超级计算机集群，他声称这是还未发布的超级计算机 Dojo（Dojo 发音源自日语，意为 “道场”）的开发原型版本。

目前，这一开发原型版本的每秒浮点运算能力（FLOPS）已经达到世界第五的水平，而其正式版本，超级计算机 Dojo 将超越目前世界排名第一的日本超级计算机富岳（Fugaku，富士山的别名）。

特斯拉用超级计算机来做什么

其实早在 2019 年的特斯拉自动驾驶开放日 (Autonomy Day) 上，特斯拉 CEO 伊隆·马斯克就介绍过 Dojo 项目。彼时，马斯克提到，“那是一台超级强大的训练电脑，目标是能够接收大量数据并在视频级别进行培训，并使用 Dojo 程序或 Dojo 计算机对大量视频进行无监督的大规模训练 (unsupervised massive training)”。

Dojo 已经是特斯拉第三个自研的超级计算机项目了。那么，作为一家自动驾驶的车企，特斯拉为何要执着于打造超级计算机呢？

超级计算机（Super Computer），通常是体量巨大、造价高昂的设备，拥有数以万计的处理器，其能够执行一般个人电脑无法处理的高速运算，规格与性能比个人计算机强大许多。常用于需要大量运算的工作，譬如数值天气预报、运算化学、分子模型、天体物理模拟、汽车设计模拟、密码分析等。

对于自动驾驶车企而言，典型的自动驾驶解决方案有三种，分别是：1）基于视觉主导，采用 GPS 地图结合 AI 人工智能进行自动驾驶；2）基于激光雷达主导，视觉辅导，采用高精度地图和人工智能进行自动驾驶；3）基于车联网主导，多种传感器融合的人工智能自动驾驶。特斯拉选择的是第一种纯视觉的自动驾驶方案，这种方案对传感器的依赖较弱，但需要极强的数据处理和 AI 能力，这就使得自研适应性强的超级计算机显得很有必要。

在马斯克的介绍中，Dojo 将配合无监督学习算法（unsupervised learning）来减少特斯拉对于人工标注数据的工作量，进而帮助其实现指数级的数据训练效率提升。（注：无监督学习算法即无需人工对训练数据集进行标注，系统可以自行根据样本间的统计规律对样本集进行分析。如不给任何额外提示的情况下，仅依据一定数量“狗”的图片特征，将“狗”的图片区分出来）。

Dojo 的性能如何

在 2019 年特斯拉 AI Day 现场，马斯克说到“Dojo 使用我们自己的芯片和针对神经网络训练而优化的计算机架构，而不是 GPU 集群。如果我没弄错，这将是世界上最好的”。

如今，对于 Dojo 的雏形机，Karpathy 在 2021 年计算机视觉和模式识别会议 (CVPR 2021) 上表示，“我们展示的是使用 720 个 80GB 版本的 8x A100 节点构建的集群。这是一台巨大的超级计算机，就每秒浮点（FLOPS）运算次数而言，我认为它可能是全球第五的超级计算机。第五位目前由英伟达公司的 Selene 集群占据，该集群拥有非常相似的架构和类似的 GPU 数量（4480 对我们的 5760，所以少一点）”。

而对于 Dojo 最终发布的期望，特斯拉在 2020 年发布的推文中表示，Dojo 能够实现每秒千万亿次浮点运算（1000 PFLOPS），这将使得 Dojo 成为一款真正的尖端超级计算机。未来，Dojo 的算力将要达到每秒钟 exaFLOP（百亿亿次, 是千万亿次 PFLOPS 的 1000 倍) 的级别，并且运算速度要超过富岳（Fugaku），成为世界第一。

而富岳是目前世界上速度最快的超级计算机，其浮点计算的峰值速度可达到 442PFLOPS（每秒 442 x 1 千万亿次浮点运算），最高性能超过 1000 PFLOPS。

在 2020 年的世界超级计算机大会上（SC20），位列前五的超级计算机分别是，日本的富岳 Fugaku，美国的 Summit ，美国的 Sierra，中国的“神威·太湖之光” 和美国的 Selene。

创作场景

特斯拉披露自家超算集群雏形，最新版本超算有望登顶世界第一？

特斯拉用超级计算机来做什么

Dojo 的性能如何