在努力的拓展技术和应用对外的边界,尽快的把技术发展到为人类所用的过程中,有很多的技术的挑战,自动驾驶行业尤其如此。自动驾驶技术发展至今也取得了很多进展,3 月 20 日北大 AI 公开课第五讲,请到了驭势科技创始人吴甘沙,他将会对自动驾驶行业现在的部署情况、AI 的发展技术趋势等等进行深刻分析,并对行业的未来进行展望。
北京大学最受欢迎的 AI 公开课“人工智能前沿与产业趋势”于 2019 年 2 月 20 日正式开课。本学期的课程邀请到了商汤科技副总裁沈徽、驭势科技 CEO 吴甘沙、微软亚洲研究院副院长周明、360 人工智能研究院院长颜水成、YC 中国创始人及 CEO、百度集团副董事长陆奇等 14 位来自产业界的大咖进行授课,InfoQ 作为 独家合作媒体 将全程跟进并对北大这 14 场公开课进行整理,敬请关注!
课程导师:雷鸣, 天使投资人,百度创始七剑客之一,酷我音乐创始人,北大信科人工智能创新中心主任,2000 年获得北京大学计算机硕士学位,2005 年获得斯坦福商学院 MBA 学位。
特邀讲师:吴甘沙,驭势科技联合创始人、CEO,致力于研发最先进的自动驾驶技术,以改变这个世界的出行和物流。创业前为英特尔中国研究院院长、英特尔首席工程师,领导了英特尔的大数据技术战略长期规划,并为中国研究院确立 5G 通讯、智能计算和机器人三大方向。2000 年以来,他发表了 10 余篇学术论文,拥有 27 项美国专利,10 余项成为国际专利,还有 14 项待审中。
以下为 InfoQ 独家整理的吴甘沙老师课程内容(略有删减)
人工智能发展简述
今天的演讲主要分成两部分:前面一半是讲 Why,也就是为什么要做这件事情?它的目标和意义何在?后半部分就是讲 What 和 How,也就是到底做什么,怎么做?
首先想问问大家,2018 年有没有感觉到难?可能绝大多数同学还没有真正的经历消费降级,如果有些同学在企业实习,可能会感觉到 2018 年的凉意。这一定程度上会让我们思考:外面很不容易,我是不是应该老实一点?
我想跟大家分享我们对历史的观察,我们发现一个巧合:每 10 年会有一个经济的周期。1988 年的时候,世界历史上第一次出现一个黑色星期一;1998 年的时候,出现了亚洲金融危机;2008 年是全球金融危机;2018 年,无论你怎么去定义,反正大家都活的很不好;2019 年有种说法,说可能是前 10 年当中最差的一年,但是后 10 年当中最好的一年。
听起来可能会让人觉得很灰暗,但是我想用历史跟大家说明:每一次经济上出现问题的时候,都很巧合的、或者是必然的带来了一次科技上的繁荣。
1988 年的经济危机带来了,无论是国外的 Google、Facebook、微软,还是国内的 BAT 都崛起了;2008 年,全球金融危机之后,差不多在 2010 到 2012 年的时候,一些移动互联网的公司和应用出现了,我们现在熟知的头条、美团、滴滴、微信、小米,都是从那个时间点出现的。
虽然对经济整体的预估还没有看到好转的迹象,但是从历史去看未来,我们相信未来几年是科技繁荣的一个孕育期。我们判断:2016 年的人工智能在信息技术的发展史上会跟 20 年前的互联网,以及 40 年前的 PC 并列成为三座高峰。
1976 年到 1996 年这 20 年是属于 PC 的 20 年,它解决的是数字化的问题,或者说是生产资料数字化的问题;1996 年到 2016 年这 20 年,是属于网络化的,它解决了生产关系的问题,通过连接口创建连接,来解决生产关系的问题;2016 年到 2036 年,我们相信这未来智能化的 20 年,能够解决生产力的问题。这 20 年过后到底是什么?没人说的清楚。有的人说:下一个 20 年,可能是我们人类探索新疆界的 20 年。所以现在人们看到 SpaceX,看到很多的跟宇航相关的创业和探索;也有人说,下一个 20 年是我们人类变成新人类的 20 年,是人类跟机器第一次开始融合的 20 年。但究竟是什么,没人知道。
那么还是先解决我们现在的问题:生产资料数字化了以后,通过网络重构了生产关系,但是现在我们不满足了,我们需要通过人工智能来提升生产力。但是人工智能是一种赋能技术,它本身并不是一个特别大的产业,比如有人去卖人工智能的工具,卖不了多少钱。人工智能一定是赋能,或者是依附在一个庞大的传统产业身上,帮助这个产业重换生机,做生产力的革命性的提升。所以有这样一个比喻:人工智能就像葡萄干,传统产业像白面包,葡萄干和白面包融合在一起变成了一种新的产品——葡萄干面包,于是整个产业的价值得到了提升。
正因为如此,我们对人工智能产业要有一些认识。首先,我们现在做很多的产业,要么是 to B,要么是 to C,当然现在也有 to G(to government),也有 to VC(to Venture Capital)等等。大家注意到 to C 的行业有一个特性,叫做赢家通吃,或者叫做网络效应,它会风卷残云般把整个行业进行重构。重构完了以后,可能只有行业的老大老二活的还可以,老三就已经很惨,老四甚至可能已经没了。
To B 的行业跟 to C 不一样,它很难一家通吃。To B 的企业成长的速率慢,可是它的生命周期也长。但 to B 是不好做的,这是降维式的打击,用穿越思维来说:你不小心穿越到清朝去了,你要去适应当时的生态,而不是说随便带着一把机关枪过去乱扫,这不能解决问题。
此外,要找到那些反人性的地方,因为真正反人性的地方才是需要人工智能的地方。但是大家要知道,反人性的地方,一定也是很艰苦的地方。如果说你抱着在空调间里面写写代码就把问题解决的思路,你绝对做不好。
第四,很多传统行业,其实现在还不具备条件进行人工智能化,因为它有些先天不足,比如它没有数据。没有数据,那么很多智能都做不起来,当然,也要找到那些有先天优势的地方。还有,一定要管理好期望差,人工智能有一个特点:就是更多的融资没办法去改变技术本身成熟的规律和节奏,堆再多的钱进去也没用。一个女人 9 个月怀胎生一个孩子,九个女人不可能一个月生出来。所以要管理这种期望差,不要觉得赶紧拿钱通过更加努力,就能够把这个东西很快做出来,这是人工智能很难的地方。
自动驾驶的特殊性
说到无人驾驶,经常有些误解认为无人车跟无人机感觉差不多,其实差别很大。不知道大家注意过没有,无人机它的创业主体是极客,自己弄一个小团队闷头去做,找到一个小而美的市场就发展起来了。但是无人车完全不一样,无人车的典型的创业配置是科学家,或者是已经工成名就的工程师再加上企业家一起创业,首先要有个很豪华的团队。其次,要建立一个非常完整的体系,什么都不能缺,什么都得有,而且它的价值链很长,团队必须要有非常强的生态的协作能力。此外,无人机空中的场景相对简单,而无人车面临的地面条件非常复杂,所以两者完全不一样。
无人驾驶和人脸识别也不一样。人脸识别可能是这次人工智能浪潮中发展的起来最成功的应用之一,人脸识别如果识别率达到 90%,多少漏掉一点没关系,但无人车只要漏掉一个障碍物就出事故了,这是它们之间的不同。如果放到算法里面,就是无人驾驶它既不能有 False Negative,也最好不要有 False Positive,比如说无人车在高速路上突然莫名其妙来一把刹车,那肯定是不行的。
另外,无人车在道路上,不是跟其他的静态的物体在博弈,而是在跟司机博弈,这是一个非常动态的环节。我们开玩笑说:以前我们觉得做无人车,像叶问一样,就是跟一个假人去练习就行了,结果发现是闯少林十八铜人阵,每个铜人都在跟你过招。
无人驾驶创业跟互联网创业也是不一样的。互联网创业经常有一种说法叫长板效应,就是一家公司只要有一两点非常厉害,一招鲜就可以吃遍天,其他的方面稍微弱一点没关系。但是无人驾驶,它讲究的是短板效应,只要任何一个地方出现短板,最终的产品就出不来。
为什么都要做无人驾驶?
接下来我们谈一谈:为什么现在大大小小的公司都进来做无人驾驶了?
先给大家看一组冷冰冰的数据:1900 年,美国有三百家车厂,整个 20 世纪,美国最后一家上市的汽车公司是福特,在 1956 年上市;最后一家创建并且活到了 2000 年的汽车公司是克莱斯勒,创立于 1925 年。也就是说 1925 年前,1900 年出现的三百家汽车公司,绝大多数都倒闭了,1925 年以后创建的汽车公司要么倒闭了,要么被吞并,所以大家可以看到这个行业它是很保守的。
但是,这个行业毕竟已经经历了一百多年,最近这 5 年出现了一个新秩序的建立,我们把它叫做“新四化”。
第一个叫做电动化。以新能源驱动电机,再让车跑起来,可能是电池驱动,也有可能是轻能源等等。第一台电动车是一八三几年发明的,也就是说,最早的汽车是电动车。一直到 1920 年以后石油的开发,包括内燃机技术成熟,才变成今天的这种发动机的汽车形态。所以,电动化从某种程度上是返祖的现象,它把造车的门槛降低了,大家最近看到新造车势力,就是借着这一波趋势崛起的。
第二个叫共享化。共享化是一种商业模式的变化,原来我们必须得拥有车,现在不在乎拥有,只在乎那一瞬间的使用,无论是通过分时租赁,还是通过网约车,它都在变成一种共享化。
第三、第四就是智能化和网联化。
这四化带来了什么样的局面呢?用一个比喻叫:世界异种格斗技大赛。这是在日本举办的一种比赛,几种不同的格斗技的人在一个舞台上把规则打乱进行竞技。套用在自动驾驶行业,原来都是汽车产业的人在竞赛,现在智能化以后,科技公司进来了,运营商也进来了;电动化之后,突然一下子卖电池的在这个行业里面占据了一个统治性的地位。全行业变成一种混战的局面,它带来的变化比很多人想象的要大。
举例来说,智能化以后,汽车的制造不用开模,靠 3D 打印很快就做出来了,制造的一些壁垒就被降低了;而网联化以后,大型货车尾部的大屏幕就可以解决后车盲区的问题。更加复杂的网联技术还有诸如远程驾驶这样的功能,随着 5G 的发展,也许这样一种商业模式就崛起了,而且安全性、环保性也都更加提升了。如果把这样的技术再进行推广,未来十年、二十年以后,马路上单个车道的流量就可以达到今天的三到四倍,电力也节省的更多。
但是,智能化、网联化,还远比不上无人驾驶带来的冲击。未来的无人车应该是什么样子?它的外表跟今天的车不太一样,它的外表会变得比较拟人化,希望在设计上给别人带来不同的感觉,设计者都试图给无人车一些赋予一些人性化的东西。
无人驾驶带来的变革与意义
无人车行业我们认为是一个水大鱼大的行业,水必须足够大,才能够养出大鱼来。汽车是一个发生着巨大变化的行业,出行也是一样。举一个例子,大家就明白了:2017 年,某网约车平台总共接单 74.3 亿单,平均客单价是 23 块钱,当时这个网约车平台是将客单价的 80%付给司机的,所以相当于 2017 年他们付给司机一千多亿。
假设变成无人驾驶的话会出现什么情况呢?
可能每单的客单价变得特别便宜,只需要 8 块钱,跟地铁没什么差别,一年的客单数可能会变成 365 亿单,也就说一天变成了一亿单,相乘起来,就有大约三千个亿的收入。这三千个亿,平台不用跟司机去分账,主要就是付出自己的一些折旧、运营的成本,它会对出行带来巨大的变化。
其次,无人车会对物流带来变化。大家不要小看物流,中国平均每个人,一年要为社会物流成本付出八千多块钱,一年大概有 12 万个亿,相当于 GDP 的 16%,成本非常高。如果通过无人驾驶,物流的成本会降到今天的 1/3。干线的运输会通过无人货车进行,末端的配送就会通过小型的机器人执行。甚至在未来,移动的鞋店、生鲜超市、医院、ATM 等等都会直接开到家门口,万物都可以动起来了。这些都是无人驾驶带来的很多新零售、新消费的空间。这是一个很大的舞台。
另外无人驾驶的发展还有一个重大的意义。现在平均一年因为交通事故死亡人数高达 140 万人,93.3%的事故原因跟驾驶员的行为习惯相关,选择无人驾驶可以减少 90%以上的交通事故,一年可以拯救一百多万人。为什么呢?因为无人车训练出来,平均有一千亿公里的经验,相当于几百万年的驾龄,而且它不自私、不疲劳、不路怒、不酒驾、不超速、不加塞,它可以减少很多的交通事故,同时由于无人车的远程网联操作,未来车跟车、车跟路随时是保持互联的,每辆车按照特定的速度,特定的次序通过十字路口,车辆行驶的平均速度就可以得到极大的提升,对城市交通也能提供巨大的帮助。
一个普通城市的双向四车道,加上两个停车道,能够怎么进行改变呢?第一,可以把中间的隔离带可以去掉,因为无人车不会开到对方的车道里面去;第二,每个车道可以变得更窄,车和车之间可以挨的很近,因为无人车始终沿着车道的中央在开;第三个,停车道可以去掉,未来如果大量出行是靠无人车的共享出行,到达目的地也不用考虑找车位停车的问题,晚上这辆车可以开到五环以外停车,白天又开到城里来提供服务,停车以后还可以进一步折叠,下一辆车开过来,又可以和它串联在一起,就像超市的购物车一样,每辆车占用的停车面积占变得非常小,所以不用停车带了,取而代之的是卸客带(drop off line)。
随着城市大量被汽车占用的空间得到释放,人、物、空间相对移动起来了,同时车里的场景也越发丰富,旅途也显得不再漫长。而这样一系列行为可能带来的直接好处就是房价的下降。
无人驾驶的发展困境
用户与环境
有一个经典的“电车问题”:两条铁轨上,一边绑着一个人,另一边绑着五个人,这时候电车来了,给你一个机会,用扳道岔的方式去救人,这时候应该怎么选择?不扳,死掉五个人,扳的话也会死掉一个人,应该怎么选?对于这个问题,现在有两个比较主流的观点:一个是觉得要保证整体的损失最小,只能牺牲少数拯救多数;另一类观点认为,每个人的生命都是有尊严的,几种观点都显得难以抉择。
同样的问题也出现在无人驾驶。假如无人车的刹车失灵,左边是五个人,右边是四个人,左边的人是戴着头盔的,右边是不戴头盔的,无人车系统到底会选择谁去牺牲?这个问题一直在争论,但是没有一个标准答案。
那么我们应该怎么去解决这个问题?我们的一个普遍的回答是:怎么选择是哲学家考虑的问题,而工程师思维要考虑的问题是怎么把刹车给修好,不要让刹车失灵。
对于无人驾驶的发展,拦路虎很有可能是用户和环境。有一组调查数据显示:约 71%的美国人是不信任无人驾驶车的。还有一个真实的案例:Waymo 无人车上路以后,遭到了路人持枪的威胁,扎轮胎、故意阻拦行驶等等,各种行为都有。还有另外一种反对的方式,比如某个新闻的报道称:美国 10 万的卡车司机不用担心了,因为美国国会无人驾驶立法当中把卡车排除出去了。大家可以看到在各个不同的国家,针对这样的一种新技术是有不同反应的。
麦肯锡做过一个调研:中国有 49%的人非常喜欢无人驾驶,只有 2%的人不想拥有,而美国和德国有 16%的人喜欢,但是有 50%的人不想拥有。中国看上去是大规模产业化的理想国,也面临很多的困难,国外无人车 Waymo 的工作环境,是在路上人很少,车也很少的情况下进行的,而国内的无人车工作环境就复杂了很多,不仅车多人多,不规范驾驶的比例也高了很多,此外还有不少外卖、快递的电动车经常突然出现造成干扰;而面对堵车、大规模的人员流动等情况,只要出现十倍以上的差别,算法一定会失效,中国的路况永远会出现见所未见的情况。也正因如此,麦肯锡预测,中国的无人驾驶普及会比欧美国家晚 2-3 年。
技术和成本
先来看一组数据。以 Waymo 的无人车为例:平均每行驶 1.1 亿英里会出现一次人工干预,行驶两千万英里还没有一次死亡事件发生,而美国人类驾驶员的水平:平均每 25 万英里会出一次险,每 50 万英里警方就会收到一次事故的通知,每 150 万英里会出现一次致伤的事故,每 94000 万英里会发生一次致命的事故。
可以看到,即使是 Waymo 的技术,离现在人类的水平还有差距。那么到底要到什么程度才能证明是安全的呢?
特斯拉曾经出现了一起致命的事故之后,写了篇博文给自己辩解。他们认为:特斯拉开了 1.3 亿英里才死了一个人,而美国平均水平 9400 万英里才死一个人,这不是比人开的好多了吗?但是大家想一想,根据统计学的原理,特斯拉采用的数据样本太小了,没有置信度,一旦第二天再出现一起致死事故,1.3 亿就要除以 2,变成 6500 万了。
美国的兰德公司调查显示:如果要 95%的置信度证明无人驾驶比人类驾驶安全 20%,则需要至少 110 亿英里的数据。相当于 100 辆车不停的开,不吃不喝不睡,至少开 500 年,也就是说你要在统计学意义上证明安全度是很难的。
如果用 Waymo 来举例的话,相当于现在有一千辆无人车,每个月要开 100 万英里,一直开 900 年;如果要花费一两百亿美金,买 8.2 万辆车,每月开 8200 万英里,也至少要 11 年。
所以我想说:方向确定、路径不确定的长赛道,是机会也是挑战。今天的领先者今后未必还是领先者,因为赛道很长,什么都有可能发生。
我这里提供几个思路。
首先是走场景化之路,抓主流大众的需求来供应,与主机厂共舞。
跟车厂共舞是很不容易的事情,想象一下,车可能是我们消费品当中最耐用,生命周期最长的一种消费品,一辆车卖出去 10 年了,终于有一天坏了,想要更换部件,但是谁能保证这家公司能活 10 年?所以这句话虽然简单但是很难做到。
主流大众的需求是什么呢?首先是在高速公路上开车,长期在高速公路上驾驶容易让司机昏昏欲睡,特别容易出事故,而这个场景完全可以通过无人驾驶来替代。
另一个场景就是停车。驭势跟一家汽车厂商合作推出的一款车,车开到了电梯口,用户可以直接下车,然后用一个手机 APP 给车辆设定一个停车位,或者让它到这片区域里找一个空的停车位,这是今天可以实现的,车身上装的传感器和控制器的成本不到一万块钱。
还有一个场景是分时租赁。分时租赁的一个痛点,就是取还车很不方便。比如用户的目的地离停车场还有 500 米的距离,但是用户去停完车再走过来又很不方便,那么自动还车就可以在用户离开之后,自动开回停车场,完成还车。另外,自动驾驶还可以解决汽车租赁的调度问题,A 点要用车但是没车了,可以从 B 点调度一些车辆过来,通过算法可以让车辆自行完成调度的过程。
这些都是主流的需求,创业也可以从这些场景入手,核心仍然是要去解决根本的问题。另外可以考虑的方向是下沉到垂直的细分场景,大公司不一定会在这些场景做的精细,比如外面、环卫清洁、矿车末端的配送、或者干线的物流等等。
但是要注意抓住几点:第一,什么是真实的需求?不要自己认为能做,就把它当作需求了,客户或许未必有这个需求;第二,经济账要算好,整个市场有多大?水大鱼才能大,成本的账要算得清楚;第三,技术一定要确保无人化。
第二个思路:草船借箭,借壳上市。
举个例子,目前在测试的无人车从停车场开出来之后,就变成了有人驾驶,在人类驾驶的过程中,车上所有的传感器都没有闲置,仍然还在跑算法,这叫影子模式,把机器的算法跟人类驾驶的结果进行比较,如果是相同,那说明自动驾驶的水平良好,如果数据不同就把数据传回来。所谓“草船借箭”就是借用户的车去学习、获取数据,“借壳上市”是说要借这个壳,把无人驾驶的算法真正用起来。当然要有“船”有“壳”,这就避免不了,要能够跟主机厂共舞,要能够解决数据的归属权问题。
第三个思路叫仿真世界的破碎虚空。
我们都知道,在真实世界里跑一亿英里谈何容易,要耗掉多少油,要消耗多少请司机的人工费用。但在仿真世界里面,只要云计算的算力足够,就可以无限测试,而且这里要求仿真要足够的真,开发者对这种场景是可控的,可以设计任意的复杂的环境。此外,这种环境是能够产生无穷的新场景的,比如模拟建筑、地面、植物、天气、光照条件等等,这是仿真世界要解决的。
最后,我想跟大家谈一谈 Innovation 和 Invention。
这两者大家经常混为一谈,我有一个简单的区分方法:Invention 就是从 Money 变成 Idea,要花很多钱,发现或者发明一个从来没有存在过的一个 Idea;而 Innovation 刚好相反,把这个 Idea 再变成钱,真正要实现它产生价值。创业做的是得 Innovation;做学术研究,获得技术突破是 Invention。
这两者都是人生价值的体现,并不一定要创业,成为百万富翁、亿万富翁,才是人生价值的实现。我觉得现在无人驾驶创业不容易,但是技术的突破,支撑着创业公司的发展。
我认为现在是个大机会时代,但是我们不要做机会主义者,机会主义者是这边打一下,那边赚点钱,必然会把所有的机会都丢了。有几个要素一样都不能少:
第一,算法要好,就好比是一个人的智商;第二,要有产品力,就相当于人的体格;第三,还要有客户能力,相当于情商,要搞定那些大车场、大客户;最后,要有学问,就相当于数据。这些要素不断的形成一个正向的循环,四种能力缺一不可。如果你觉得自己只擅长算法,那就要找一个工程能力非常强的帮手,找一个客户能力非常强的帮手,你们一起来创业,才有可能成功。
总结一下今天跟大家就分享的内容。
为什么要大大小小的公司都要做无人驾驶?因为它真的是一个很大的舞台,具有巨大的意义;在真正的创业,或者是在学术研究的过程当中,要清楚的知道自己想要解决什么样的问题,通过什么样的路径去解决,是要找到大众的需求,还是找垂直细分场景;要想清楚怎么去解决数据获得性的问题,怎么去解决开放动态的环境问题,然后我们才可以去创业,一定不要做机会主义者。此外,我们也可以在学术上获得突破,因为现在还有很多问题没有解决。
对话吴甘沙
Q:无人驾驶这个产业和其他产业不太一样,这个领域非常大,但真正创业公司没有那么多,不像互联网,一上市能够千团大战。但是我们又看到每家无人驾驶公司的估值都特别高,您是如何看待这个情况的?
吴甘沙:自动驾驶真正进一步到创业阶段,你会发现它太难了。首先它对人才的结构,对整个技术体系的完整性要求非常高,因为一般人都请不来这么多的大神来够建构一个非常完整的技术体系。我刚才说,它是短板效应,一块地方短了都不行。这里我要强调一下,建构一个完整的体系并不代表什么都得自己做,但是你如果,这个地方你不同,你很容易做,然后也可以用最好的东西,建构就是这么一个复杂的体系。
其次,它其实是有一个很长的过程。第一步叫 Demo,要演示出来;第二步叫 Deploy,要部署出去;第三步叫 Deliver,要真正交付;第四步才进入量产,它的这个周期非常长。组织能力要足够好,因为可能很长时间不会有大的收入进来,那这个团队是不是能够稳住,此外,融资能力必须得非常强,等等。
最后,融资也好、堆人也好,它没办法加速技术的发展,因为它有它本身的内在的一个规律,那么这时候,我们就要特别小心去找到能够落地的一些场景。所有这些综合下来,就是一场马拉松,能够进入最后一层的冲刺的公司不会太多。
Q:既然自动驾驶这么困难,您觉得现在还有可能在这个行业中创业吗?如果有在什么地方还有可能?
吴甘沙:现在我能看到的创业的可能,主要是在一些核心的组件的技术上。可能某家公司做了一种新的传感器,这种传感器能够显著的提升自动驾驶对环境的识别能力,哪怕是在一些特殊环境下,比如夜间场景等等,如果你可以在一项技术能够做到极致,我认为还是有很多的机会的。
还有一些大家还不是特别关注的领域,比如说安全,这个安全不是 safety,而是 security,未来智能的网联的汽车,安全一定会是个大问题。如果说你是一个技术特别强的人,但是你又没办法组成一个体系性、完整性非常好的团队,那么做这种“点技术”,还是有机会的。
另外我补充一下,做硬件的难点是在什么地方?技术原理都走通了,并不代表你能成功,因为一定会出现良率的问题,无论是固态激光雷达,还是其他的自动驾驶配件,它们的原理都可以走通,但是最终良率卡在 10%,20%,这是没有办法的。
Q:一个完整的自动驾驶团队都会用到哪些比较深的技术?尤其是跟人工智能有关的技术,这些团队,他们大概的组成的配比是怎样的?成员之间怎么协作?
吴甘沙:其实在不同的阶段是不一样的。在一支创业公司团队早期的时候,可能绝大多数都是研发,比如说一半是做软件的,一半做硬件的。那么随着公司越来越从项目驱动往产品驱动转型发展,你就会发现硬件成长比较慢,而软件迭代更快些。
第二,这个体系里面,一定是既有车端又有云端的,它们要解决的是不同的问题。车端要解决硬件便宜可靠,可能还需要考虑功耗低,散热好等等一系列的问题;软件就是主要的 AI 技术发挥作用的地方,比如 OS 实时性要好、可靠性要好、延迟要低、可预测性要强,算法和深度学习模型要能够在便宜的硬件上能跑起来等等。云端要解决的问题主要是数据管理、高精地图、仿真、车辆的运维等等。这其实是一个典型的产业互联网的场景,车端的所有这些零部件都是联网的,在零件出现问题的时候你、要及时止损,甚至是预测性的发现问题,比如说传感器被遮挡了等等,要及时的发现。
总的来说,它确实是体系性要求非常高,横跨了 AI 的算法,汽车的软件工程和硬件的工程,包括通讯、包括云端的大数据的管理等等,是非常完整的一个体系。
最后再补充一下,一开始的阶段可能会做大量的算法,但是到了一定程度以后,决策的重要性变多了。比如 Waymo 去年人工接管的案例大概一半是跟决策相关的,1/4 是跟感知有关的,还有可能不到 1/4 是跟路上不理性的一些行为有关的,还有一些就是跟软件、硬件的错误有关,此外还有天气的状况的影响等等。
但是可以看到,尤其是跟路上的行人的博弈,以及与其他司机的博弈的阶段,决策的重要性就凸显出来了。
Q:技术更新换代速度很快,今年学一项技术,明年还有没有用就不好说了。您觉得学习技术怎么能锻炼一些让自己能够长时间都可以有用的能力呢?除了算法之外,到底怎样才能让自己就是学到能更有效、更长时间伴随自己的能力?
吴甘沙:技术更新真的是非常快,而且说实话,这一波 AI 所依赖的技术基础,比如深度学习基本上都碰到瓶颈了,现在想在 ImageNet 上再提高 0.1%已经很困难了,技术必然在不断地变化,我们也要不断的学,但是学的过程当中,你学到的不是技术本身,而是一种“元能力”,是你不断学习新的技术的能力,而不是新的技术本身,这点非常重要。
它对我们的要求是什么呢?就是不能流于表面。比如说,随便装个 Tensorflow 的工具链,再到 GitHub 上面随便找一个模型,很快就能把一个事情做起来了,即使你不断的更换也是学不到东西的,你需要的是钻深的技术。
我觉得现在很多事情都太容易得到满足了,现在世界的物质如此丰富,很多梦想都太容易实现了。比如打游戏的时候,你随便买点装备很快就通关了,这个没什么意思,你应该靠自己的本事去练出来真正打通关的能力。
我有时候很诧异,我们以前读书的时候真的是条件很差,你要去买一本 C 语言的编程的书要跑很远的书店去买,我们那时候为什么喜欢看武侠小说?因为都希望掉到一个山洞里就能发现一个武功秘籍,然后练成“绝世神功”。现在绝大多数人手头全都是武功秘籍,但是没时间练。
如果说每出来一个新的 CVPR 论文,你都能找到论文、找到原代码、找到模型,真正能够去理解它后面的东西,在这个过程当中,你其实就在积累你的语言能力,而不仅仅是运用这门技术的能力。以前有一句话:你要选择一条少有人走的路。随便拿一个模型过来,训练一下马上就能用,虽然很爽,但是没有什么用,你要走那条少有人走的路,这样才能在技术的迭代当中,不断增强你的竞争力。
评论