自动驾驶创业方向有变化？如何突破技术瓶颈？

自动驾驶无疑是截至目前，今年最受投资青睐的一个细分领域。据业内人士介绍，这是继 2014、2015 年以来，自动驾驶领域的又一次投资热潮。有专业人士认为，这次投资热潮中有明显的投资趋势转变特征出现。具体表现在，与 2022 年 Q1 偏向 ADAS 以及高级别自动驾驶系统级解决方案提供商不同，Q2 获投技术领域分布比较均匀，从感知层的毫米波雷达、激光雷达到决策层的芯片、计算平台，再到执行层的智能底盘领域，均有企业获得了新一轮融资。这种转变的背后，是否展现了自动驾驶未来技术演进的方向？带着这样的疑问，InfoQ 编辑采访了智行者 CTO 王肖和智行者联合创始人、研发中心副总经理张放，以及多位机构投资人。

难以突破的自动驾驶核心技术

多位机构投资人和创业者均表示，投资方向的转变并不是近期发生的。事实上，投资方向转变需要放置到自动驾驶及其相关产业的整体发展进程来判断。从风险投资早期阶段来看，投资是紧跟随产业发展需求的脉络进行的布局。比如，早期投资机构联想之星 2014 年就入局投资自动驾驶，称得上是行业的先行者。2014 年起，联想之星投资了 ADAS、毫米波雷达、 AEB （自动紧急制动）、激光雷达自动驾驶零部件方案的供应商。2015 时，自动驾驶研发迎来大爆发，联想之星投资了解决方案提供商 Pony 。2018 年开始，联想之星先后投资了以小马智行为代表的自动驾驶整体解决方案的初创公司。2018 年后，自动驾驶从此前追求单车智能，逐渐转变为“聪明的车+智慧的路”。联想之星的投资也向着更广的方向发展，投资了地图、智慧交通等领域的公司。不难看出，联想之星的投资布局动线图，紧跟着自动驾驶及其相关产业的整体创业趋势。不少投资人坦言：“最近，我们并没有观测到有新的技术突破。”

软硬件在短时间内很难发生实质性的突破。所以，智行者 CTO 王肖认为：“L4 未来的趋势是要满足常用场景的商业化落地，把实现无人驾驶的成本降下来。产品策略方面也是需要自动驾驶提供商需要突破的关键所在。”

自动驾驶是人工智能深度学习的一种应用。自动驾驶汽车关键技术主要包括环境感知、精准定位、决策与规划、控制与执行、高精地图与车联网以及自动驾驶汽车测试与验证技术等。简单说，自动驾驶核心技术体系可概括为“感知、决策与控制执行”（如下图所示）。

图 1：自动驾驶核心技术

感知与决策与是无人驾驶中最难突破的两个模块，也正是这两个模块决定了自动驾驶等级。这两个模块可通过车载摄像机、激光雷达、毫米波雷达、超声波等传感器来感知周围环境，实时动态监测周边环境变化，并依据所获取的信息进行决策判断，形成安全合理的路径规划。

市面上推出的自动驾驶解决方案，也基本是围绕着这两个模块展开。这两个模块构成了自动驾驶的决策规划能力。面对人工智能算法以及以毫米波雷达为代表的感知系统方面的现有局限性，自动驾驶方案提供商需要在极度安全与极度智能这两个维度中找到平衡点。投资人普遍认为，软硬件的突破确实不易，如何在产品策略方面推出能够落地商业化综合应用是众多玩家未来的主要策略。

深度学习算法以及感知能力的瓶颈该如何解决？

目前，深度学习还有尚未突破的痛点。比如，在高速路上行驶，广告牌上若有人像，汽车“大脑”会误认为是人，发出提示音。原因是深度学习尚未达到与人类相同的判断能力。 “基于深度学习的视觉系统，不可能把万事万物都学习一遍。”王肖解释道。

再有，近期出现的多起电动汽车安全事故，都是撞上了高速路上的静态物。这不仅有上述的深度学习原因，也有感知层面中毫米波雷达的固有弊端。最常见的有，由毫米波雷达对金属比较敏感，有时会误将龙门架识别为汽车。

以上提及的深度学习算法以及感知能力到底该如何解决？如果是特斯拉这样单纯使用视觉识别是否可行？纵观业内众多解决方案，主要是两种方法。一是多融合感知方案，用决策逻辑弥补感知问题；二是在云端自动化的实现算法迭代，通过数据驱动的强化学习来训练决策逻辑。在本月 17 日，召开了新品发布会的智行者，向外界发布了“轻地图，重感知”的解决方案。这套解决方案包含了以上两种方法。

张放直言，智行者不是纯视觉支持者。“如果后端决策规划能力没有上来之前，采用纯视觉识别永远是有问题的。最典型的是夜间场景。我们推出的 H-INP 系统恰恰弥补了这一缺点。”

据悉，H-INP 采用了 6 颗摄像头+5 个毫米波雷达的多融合感知方案。这种解决方案可以减少对高清地图的依赖，从而实现“轻地图，重感知”。不依赖高清地图，也是中国自动驾驶厂商未来拓展海外市场必须具备的能力。

此外，在硬件架构配置方面，H-INP 还采用了智行者自主研发的车规级高算力域控制器，算力可达 128TOPS，CPU 计算能力达 30K DMIPS。结合上述的多融合感知方案，实现了成本的有效控制，既满足了车辆安全运行的需求，又达到了前装量产的标准。据智行者介绍，目前 H-INP 的成本在数千人民币。智行者希望通过低成本的方式，快速推进自动驾驶落地，进而形成商业闭环。目前，这套系统还处于原型测试阶段，预计今年第四季度推出量产版本。

据张放介绍，H-INP 采用了平台化设计，可在此统一架构下开发出系列产品，满足不同场景的需求。在整体系统架构的设计方面，H-INP 具有功能模块化、接口抽象化等特点，具体表现为：

1.将架构进行了分层解耦，可以更加便利地利用最新技术成果；

2.算法模块化复用，通过图形化工具实现应用设计、开发、集成和调试，将研发聚焦在算法本身；

3.深度优化的通信和调度机制，提供多级通信机制与模块部署的局部性特点相适应，提供确定性和 CPU-GPU 联合调度。

图 2：智行者 CTO 王肖

在构建多融合感知方案中，智行者实施了以下三个步骤，以通过语义理解生成一个实时的云端地图。整个过程，还原和模拟了人在开车时的真实情境。“通过眼睛感知外部事物，从而在大脑中形成了外界地图。”

第一步是准确的目标和准确的检测能力。通过传感器准确传回所需要的数据，要精确的“看到”车道线、标志牌等道路元素。

第二步 3D 场景重建的能力。在感知算法的基础上，尽可能在 3D 场景中准确还原传感器传回的“图景”，并把离散在不同时空中的每一帧融合为一个完整的物理世界。

第三步是语义理解，理解周遭环境的能力。只有经过逻辑关系和拓扑关系处理之后，才能做出最终的决策规划。比如，经过前两步实现了完整清晰的物理世界，抓取到了车道线等道路基本相关信息。那么，接下来，车辆在行驶中要如何利用这些抓取到的这些信息，来判断是左拐还是右拐？这就需要第三步逻辑关系去处理，形成决策规划，然后输送给控制单元进行实施。

用数据驱动迭代算法，从而提升自动驾驶能力也是智行者着重提升的能力维度之一。这其中涉及到如何去快速挖掘数据，清洗数据和更新云端的算法模型。张放认为，有用的数据才能反馈出真实问题，提升算法。快速发现数据就是要自动化的挖掘有意义的数据。这些数据通常是在边界或者目前尚未解决的场景。张放补充到，在此环节，智行者先采用仿真系统测试一遍算法模型，之后再将有效的数据运用到真实车辆进行试验。这样做可以提升开发效率。

综上，智行者用在夯实能力的基础上，使用了产品策略来实现其从特殊场景、特种车辆等场景延伸至乘用车领域。

“必经战事”：商业化场景落地

今年 8 月初，百度发布了一个声明：已获得中国武汉、重庆两个城市的批准，可以向乘客提供全无人驾驶网约车（ Robotaxi ）有偿服务。但这并不意味着无人驾驶可以进行大范围商业应用。只有达到现有网约车相同的实用性，彻底拿掉安全员、不限目的地、不限区域的自动驾驶，才是真正的商业化。我们熟悉的理想、蔚来、小鹏以及特斯拉实质上应用的都是 L2 级别的辅助驾驶系统。L5 级别的自动驾驶（完全无人驾驶）实现还需要很长时间的探索和落地试验。传感器、算法软件等将是无人驾驶技术本身需要攻克的难关。另一方面，能否在现实场景中实现无人驾驶与整个交通体系密切相关，这又取决于智慧交通的发展。

图 3：合流分流

在这篇文章创作之初，InfoQ 编辑曾联系过多家曾经投出了自动驾驶明星项目的早期投资机构。事实上，已经有投资机构将注意力转移到了其他领域。有关人士指出，目前各个赛道的竞争格局已经形成，加之技术创新周期长的原因，接下里的竞争主要集中在商业化落地场景中。此前，毕马威中国则预测，中国主要城市将在 2030 年实现自动驾驶的大规模应用。自动驾驶很可能在下个十年以网约车或物流配送车的形式进入市场。

据智行者介绍，其已在特种场景和室外无人环卫车细分市场中进行了布局，且所占市场份额不低。此次发布的高速领航系统 H-INP（Highway – Idriver+ Navigation Pilot）表明智行者正式进入了乘用车领域。未来，还将打造适用于城市场景的城市领航系统 C-INP 系统，可实现不同时段（白天/夜间），人车混行交通流下的辅助驾驶。

上述的感知与决策模块，以及商业化场景落地探索问题，都可以采取产品策略进行缓解。但是，还有许多业内人士指出，算力已是制约当前自动驾驶向前发展的一个重大考验，同时也是自动驾驶系统得以大规模落地以及进一步实现商业化的前提条件。在提及算力之前，当前芯片短缺已成为汽车行业的巨大痛点。

创作场景

自动驾驶创业方向有变化？如何突破技术瓶颈？

难以突破的自动驾驶核心技术

深度学习算法以及感知能力的瓶颈该如何解决？

“必经战事”：商业化场景落地