在刚刚结束的 2016 亚洲电子消费展(即 2016 CES Asia)上,从崭露头角的初创企业到全球知名品牌,集中展示了 3D 打印、智能家居、汽车智能技术及可穿戴设备等 15 大类别产品的创新成果。VR、智能机器人、自动驾驶和无人机等智能技术与设备依然成为主旋律。可见,汽车已然成为了继电视、电脑、手机之后兵家必争的第四屏。
在 5 月 14 号由百度开发者中心和百度车联网联合举办的第 62 期“智能语音和大数据护航车联网解决方案”技术沙龙上,来自百度车联网 OEM 解决方案 CoDriver 和 MyCar 的项目负责人刘凯和栾宁给大家详细讲解了百度是如何帮助车主提供基于智能语音识别技术和大数据分析技术的行车解决方案的。同时,来自传统车企长安汽车的车联网平台负责人蔡春茂站在传统车企的角度,分析了他们的切入点以及在车联网方面的发展成果。
解放双手的语音副驾 CoDriver
刘凯说,在目前的车载场景下,其实有很多痛点需要解决的。因为生活场景和信息服务方式在不断的发生变化,驾驶者获取信息和获取服务的需求不能很好地被满足。这时候就需要通过智能语音助手来满足驾驶需求,带来更好的驾驶体验。在保证驾驶者的安全问题前提下,CoDriver 真的能像副驾驶一样,帮助驾驶者分担查询信息、获取服务、导航、打电话、听音乐等需求,真正地帮助驾驶者解放双手。
下面我们就一起来看看 CoDriver 到底具备哪些核心技术:
CoDriver 目前需要通过像“小杜你好”这样的词来语音唤醒它,通过语音技术的识别把用户说出的话识别成文字文本,下一步要做的就是解析成一个 CoDriver 可以理解的驾驶者意图的结果,这个过程其实就是一个分词的过程。
语音合成,目前百度在语音合成部分积累了包含多音字的合成以及多种有感情的语音合成,根据用户需求也推出了不同的可定制化的明星语音 GPS 播报,主要用于导航过程中给用户比较好的体验。
多轮对话技术,这也是归属到语音解析的自然语言处理范围之内,刘凯老师举例说:“明天北京飞上海的航班”,CoDriver 可以结合上下文的理解,选的是国航的北京飞上海的航班,结合上下文的理解作出判断。目前多轮对话技术已经是在 CoDriver 的 POI 检索以及多轮打电话的联系人确认的过程中应用了。
其次就是降噪算法,在车载场景下的一些噪声处理,有专门的软件降噪算法以及硬件的麦克风阵列的降噪算法。
麦克风阵列是将两个麦克风的信号耦合为一个信号。亦即在两个麦克风的正前方形成一个接收区域,进而削减两个麦克风侧向的收音效果。语音增强是指当语音信号被各种各样的噪声(包括语音)干扰甚至淹没后,从含噪声的语音信号中提取出纯净语音的过程。所以在车载嘈杂环境下,也能准确识别语音指令。
所以麦克风阵列技术不限制说话人的运动,不需要移动位置以改变其接收方向,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,因而成为智能语音处理系统中捕捉说话人语音的重要手段。
功能方面,有一些最核心的几个需求,例如地图导航、电话、短信的收发需求,生活信息的查询等等,这些都可以通过百度强大的搜索能力来完成。对于车主服务,比如洗车、加油、美容等服务,结合车后服务和车主服务来实现这些功能是非常容易的事情。所以通过语音、语义、智能反馈的技术叠加,再加上百度的云服务以及视觉技术和百度大数据技术,百度 CoDriver 的能力以后会越来越丰富。
MyCar 在大数据处理方面的核心技术
首先,百度 MyCar 的项目负责人栾宁给大家分享了 MyCar 究竟为何物:百度 MyCar 是集车主服务、车后服务和云计算数据的私有云服务平台,为车提供个性化定制、安全管理的解决方案,为每一辆联网车辆装上“百度大脑”,提高智能用车体验。
那么百度为什么要做车联网这件事?首先是基于百度地图积累了很多的路况数据,其次,百度已经为超过六千万的车主提供了服务,在车主数据以及 B2B 上有着得天独厚的优势。MyCar 希望利用百度大数据处理优势,进一步分析数据,给车主提供优质的服务。
下面我们来看一下 MyCar 都有哪些功能,以及它的核心技术在哪方面!
首先,车上的数据可以传输到云端,用户可以通过手机 APP 远程查看操控车辆,以及获取车辆的相关服务,包括位置服务、智能体系、车辆管家、数据分析或者是托管服务。
MyCar 提供的实时获取车辆位置有什么好处?
- 可以远程地查找车辆,包括室外停车场以及地下停车场。
- 车况的展现,包括油耗分析、续航里程、百公里油耗以及车门车窗的开关情况以及车况的自检。
- 远程控制,包括远程开关车门车窗、后备厢、天窗等等。
除了数据的展现之外,MyCar 还做了进一步的简单化数据分析,包括油耗分析,行驶轨迹分析,这些数据对于建立车智能模型和大数据分析起到了很好的铺垫作用。MyCar 更多的是基于车辆数据的采集,数据的传输,以及服务打通和安全性方面提供优质服务的。
下面介绍一下 MyCar 所使用的两项核心技术。
- 第一个是鹰眼。它是一个位置数据采集、上传、存储的技术。首先它包含了室内定位,室外定位,轨迹和回传。
- 第二个是数据处理器的存储和检索服务。百度服务器的稳定性非常高,还可以实现实时的轨迹检索和历史服务。
- 第三个是慧眼。百度慧眼是基于百度地图 GPS 数据分析的工具。它可以基于人的属性、兴趣爱好、消费场所等因素制作用户画像。
最后一点,栾宁也谈到了安全方面的技术问题,如果数据不安全,那么一切都是空谈。
栾宁从系统层、应用层和云端技术三个角度介绍了 MyCar 的安全性。
- DDoS 防护:自动清晰攻击流量防御 SYN Flood,UDP Flood,CC 等 DDoS 攻击。
- 云服务器防护:自动拦截密码暴力破解,实时检测通知异常登录。
- Web 漏洞检测:智能扫描云服务器上网站可能存在的 SQL 注入,CSRF、XSS 等漏洞。
- 端口安全检测:定期扫描服务器上的开放端口,通告风险端口,降低服务器被入侵风险。
长安汽车车联网平台在建心得
蔡春茂是长安汽车车联网平台的项目经理兼技术负责人,他主要是从整车厂商的角度阐述传统车企在面对车联网大浪潮时的困惑、反思、平台建设思路、设计理念、技术架构、以及和互联网公司合作的案例心得。
首先,蔡春茂站在车主的角度分析了现在汽车后端服务行业里的几个困惑:用户续费意愿低、服务体验差、产品没有粘性、功能定位方向错误、厂商无数据、创新慢。车联网仍在探索,参与环节和厂商越发繁多、庞杂,各利益主体之间纠葛随之增多。但即使是这样,不管是前装车厂还是后装车厂,都在搭建自己的平台。而传统车企在这一方面所遇到的困难相对较多,没有标准,数据少,整车是比较封闭的,包括车主也不愿意把数据提交给车厂。其次是车上功能很复杂,操作麻烦,体验不一致。
那么长安汽车是怎么做的呢?探索商业模式创新,构建安全、绿色、便捷的出行服务整体解决方案,即长安自己的车联网平台,以此不断提升产品价值。具体措施是自建+合作。整体思路是走“轻平台”思路:核心自建、数据自有、服务合作的原则。详细流程看下图:
这里,我们重点来看一下云端的建设。云端建设更多的是保持开放性、扩展性,终端、平台、服务商解耦合,强化管控;支持多服务商,多设备的原则。长安汽车现在正在建的 TITAN 平台,大数据分析平台、服务集成平台、容器管理平台等等,都处于探索阶段。
根据长安汽车的车辆数量,设计了如下图这个高可用设计的云端架构,所有的数据都可以通过这个平台发给第三方合作伙伴,内部也是在数据存储上做服务,通过数据异步写入HBase、HDFS,利用 Spark 进行数据处理,最后会把数据分析放到不同的 MySQL 里进行预处理。
在大数据分析这一块,长安汽车也属于起步阶段,通过采取场景建模、ETL 标准规则建立和预测建模等方式,制定出相似度计算、推荐算法、文本挖掘算法、机器学习等规范化成果。通过对第三方数据交易、共享数据交换、数据合作模式研究等数据整合处理手段,获得驾驶行为、群体驾驶特征、车辆工况进行分析,车辆零部件跟踪和故障隐患分析、车辆能耗消耗等有价值的结果。
当然,对于一个传统的正在尝试新领域的车企来说,自建是一个好的办法,但是向互联网科技公司借力也是一个不错的方法。在跟百度的合作中,百度提供了包括 MyCar、CoDriver、远程控制等方面的支持。
总结
最后,引用吉利集团董事长李书福的一句话作为总结:传统的汽车公司是不会那么容易被颠覆的,但汽车公司必须拥抱互联网,与互联网相依相生、携手共进才能在信息革命时代长久发展下去。
评论