本文为 Robin.ly 授权转载,文章版权归原作者所有,转载请联系原作者。
Robin.ly 是立足硅谷的内容平台,服务全球工程师和研究人员,通过与知名科学家、创业者、投资人和领导者的深度对话和现场交流活动,传播人工智能行业动态和商业技能,打造人才全方位竞争力。
2019 年 3 月 9 日 Robin.ly 交流活动邀请到全球最大的联合办公空间公司 WeWork 的技术工程副总裁和荣誉科学家、IEEE Fellow 王海勋博士与硅谷的相关领域的工程师和研究人员分享自己对于人工智能与物联网的观点。
王海勋曾担任 Amazon 自然语言研究部主任、微软亚洲研究院高级研究院、以及 Google、Facebook 等公司重要研究职位。他的研究涉及 natural language processing, computer vision, robotics, data management, sensor networks 等领域。
我眼中的物联网
物联网这个领域还比较年轻,很多相关从业者都在 IT 或者数据行业工作,致力于机器学习和人工智能方面的研究和应用。总的来说,在过去的几十年里,我们实现了不少行业突破,比如 Gmail 现在能够自动帮助我们补齐完整的句子。类似的服务还有很多,而且大部分都是免费的。然而在我们的物理世界中,情况就不一样了。
几个月前我去了趟上海。有一次乘坐电梯,发现三面墙上各有一个广告屏幕。不仅如此,在正对电梯门的墙上还有一个投影仪。当电梯门关闭时,它会在电梯门上播放广告。所以你一进电梯,就会被各种广告狂轰滥炸。所以在物理世界中,你同样也会得到很多这样的信息,但大部分对你没什么用。
几年前,Jeff Hammerbacher 离开哈佛,加入了 Facebook,负责广告业务。他说过一句至今听起来仍然意味深长的话:“我们这一代最聪明的人都在思考如何让人们点击广告。这糟透了。”一方面,互联网的确给我们的生活带来了很多便利。互联网到处都充斥着广告,这也是为什么我们可以免费得到很多东西。但另一方面,在现实中我们的生活并没有发生同等的改变,很多事情还是要亲力亲为。
人工智能如何改善生活
人工智能的另一个非常有趣的领域是人工通用智能,关于人工通用智能是否会实现,什么时候实现存在很多争论。但我更愿意相信迈克尔·乔丹的观点。去年,他在 medium.com 上发表了一篇文章,题目是《人工智能——革命尚未发生》。他想表达的是,与其研究这种人工通用智能,试图与人类智能一较高下,我们在现实世界中还有很多问题需要优先解决。
他在文章中给出了一个医疗领域的例子:当时他的妻子怀孕了,医学诊断的结果表明婴儿可能存在一些先天缺陷。而身为统计学家的迈克尔在研究了这份报告后,得出了这样的结论:做出这种预测的设备已经升级了,能够得到更好的图像,但是潜在的预测机制沿用的依然是几十年前的方法,这种技术上的脱节就会导致误诊。他的发现也意味着婴儿并不存在先天缺陷,也没有必要做手术。所以他认为,如果我们能把人工智能运用到这些系统中,让这些系统变得更加智能,我们的生活就会得到极大的改善。
我在亚马逊,谷歌和 Facebook 都工作过。所有这些公司都见证了过去几十年来技术的发展。它们都是互联网领域的佼佼者。但我想做些改变,想加入一家真正致力于改善物理空间的公司。我们的技术总部在位于旧金山的 Salesforce 大楼里。每天早上人们来上班,都要刷门卡才能搭乘电梯,还需要输入楼层数。每个工作日我们都要重复这样的操作,没有人帮我们把这个过程自动化。SalesForce 大楼的电梯已经算是智能电梯了,你只要在大厅按下楼层号码,屏幕就会告诉你该坐哪部电梯,所以你不需要在电梯里输入任何数字。这就是他们所说的智能电梯,但这与 160 年前纽约市出现的第一部商用电梯并没有太大的不同。
大概五六年前我在位于 99 号楼的微软研究院工作。我们当时发明了一种叫做智能电梯的东西,能够依靠计算机视觉识别特定的人,并根据你使用电梯的习惯,把你送到你应该去的楼层。但很遗憾,这一试验的效果并不好。因为微软的 99 号楼只有 4 层,并不算什么高楼大厦,人们经常会去不同的楼层参加不同的会议,所以很难预测。不过这的确是个有趣的实验,目的也的确想要改善人们的生活。
大概一年前,我在西雅图第一次体验了 Amazon Go 无人超市。整个过程都很顺利,除了在整理货架的工作人员,收银台完全见不到人。离开超市 10 分钟后我收到了电子收据,我不禁感到很惊讶,他们到底是怎么做到的?后来我在 Amazon 遇到了一个参与了该项目的人,他告诉我,其实是有人通过查看购物录像来判断计算机视觉算法所做的决定是否有误,并确保你收据上的信息是准确的。所以目前它还是需要人工的参与,但最终,我相信随着技术的进步,至少我们在购物方面的体验会越来越好。
个人早期经历
在高中时期,我开始接触编程,第一次用 C 语言打出了“hello world”。那时的我很希望能够有可以通过代码进行互动的玩具,而现在我们有了很多选择,比如 Arduino 单片机。这是一个通用的开源平台,你可以通过编写程序对它进行自动化。
还有一个功能更强大的工具叫做树莓派(Raspberry Pi)。它基本上相当于一台 Linux 电脑,你几乎可以在这个设备上做任何事情。我们在做计算机视觉时,在这个设备上运行了很多深度学习模型。最重要的是,可以在上面安装各种摄像头,监控周围的环境。我们还能用它来什么呢?我在 Palo Alto 工作,知道在那里找停车位很让人头疼。市政府把市中心的停车场分成了不同的区域,每次你只能在同一个区域停车两个小时;需要停更长时间的话,只能开到比较远的另一个停车区。市政府还雇佣了很多人进行监督,防止有人违规停车。但是很明显,你只要骑着安装了树莓派的自行车穿过停车场就能实现同样的目的,而不需要那么多人。
智能建筑环境
现在很多人都在研究无人驾驶汽车,但这么多年过去,我们仍然没有看到一个真正有效的解决方案。因为其中一个原因是,不仅要让车越来越智能,还要让环境变得越来越智能,让城市,道路,交通可以和无人车实现即时沟通。做不到这一点,无人驾驶的安全性就无法保证。但除此之外,我们还要思考如何让建筑自动化和智能化。WeWork 目前正在全球范围内建造 400 多座智能建筑,安装各种智能设备。这种智能建筑相当于一个大型机器人,可以与建筑内的任何电子设备交换信息。
当建筑变得非常智能,我们就可以在建筑里做很多事情,例如部署机器人。这些是我们为 WeWork 建筑设计和制造的机器人,比制造无人驾驶汽车要容易得多。在我们的建筑里有很多不同类型的传感器,它们都会和机器人交互。这些机器人有发达的感官系统,也非常熟悉建筑中的环境,因而可以帮我们解决很多问题。
我们还在做很多其他的尝试,比如通过一个室内环境的 3D 图像,可以分辨室内的所有物品。在图像识别领域有一个非常大的项目叫做 ImageNet,而在这个空间中,我们还有一个叫做 PointNet 的项目。我们把搜集到的数据称为点云数据,有了 PointNet 数据库,我们就能够构建计算机视觉算法来检测这个点云数据中的对象。有了这些数据,我们就能够从事很多有趣的项目,尤其是 AR 和 VR。例如在设计阶段,我们可以在 3D 虚拟环境中放置一件家具。我们每个月差不多要建造 50 栋建筑,因此如何扩大设计的规模,对我们来说是一个非常重要的任务。
另一个非常重要的因素是人。正如我在演讲开始时所提到的,我们希望能够在物理空间为人们服务,不仅能够提高效率,也许还能够改善他们的身心健康。所以我们正在努力优化办公环境,不过相比几十年前,我们的工作环境已经有了很大的改善。
除此之外,我们还需要进行大量的环境测控,这就要求我们在物理空间中放置很多传感器。比如一家公司会使用 WiFi 信号来测控空间的使用情况。这可能是最便宜的方式,因为几乎每栋楼的每层都有 WiFi 信号。你不需要安装新的硬件就能知道这栋楼的空间使用情况。但另一方面,WiFi 信号只能让你了解粗略的情况,比如现在这一楼层大约有 100 人,却不能告诉你这些人在不同房间的分布情况。为了做到这一点,就需要额外的设备。很多公司现在也正在研究相应的方案。
再考虑一下打扫卫生的情况。有人计划把传感器放在卫生间隔间的墙壁上,试图测控卫生间的使用情况。但这样一来,你在使用卫生间的时候就会感到很不舒服。然而这对 WeWork 这样的公司来说很重要,因为我们现在在全世界有 400 座建筑,有一个大部门负责打扫这些浴室,所以我们也需要在这些领域寻找解决方案。当然上述解决方案有些不妥,我们并不打算采纳。那么要怎么知道什么时候该打扫哪个卫生间呢?按顺序一间一间打扫整个大楼的卫生间是对资源的巨大浪费,也会因为等待时间太长而给客户带来困扰。因此,我们想要使用一种非侵入性的技术来解决这个问题。实际上这并不是一个全新的领域,人们在小的传感设备的基础上已经开发了很多应用程序,比如在日本有很多独居的老人,这样的设备可以让这些老人的生活更方便,更安全。这种技术在办公场所也有很多应用,比如适时补充办公用品。
情绪检测
我们还对人们的活动和情绪进行了大量的测控。比如在这样的讲座中,我们就能够检测到台下观众的活动——他们是在专心听,还是感到无聊忍不住玩手机。会议对于公司来说非常重要,所以有了这样的信息,公司就可以做出安排或调整,提高这些活动在工作空间中的效率。
MIT Media Lab 是 HCI(Human-Computer Interaction)领域最前沿的团队之一。在他们的一项较新的研究工作中,研究人员把环境中的信号,比如 WiFi 信号发送给一个人,然后接收从这个人身上反射回来的信号,就像雷达一样。通过读取从这个人身上反射回来的信号,你就可以了解关于这个人的很多信息,比如心率和呼吸节奏,通过监督学习的方法就能做到。HCI 在物联网时代变得越来越受人瞩目,令人兴奋的研究成果层出不穷。
正因为我们想了解人们的感受,人们如何与物理空间互动,所以在这个领域进行了很多探索。我们在 Palo Alto 成立了一个新的研究机构,主要致力于五个领域的研究:自然语言理解和机器学习,计算机视觉,HCI 和机器人,计算经济学和计算社会科学。
访问 http://bit.ly/2NNN7rx 或点击 “阅读原文” 观看完整视频并下载 PPT。
本文转载自 Robinly 微信公众平台。
原文链接:https://mp.weixin.qq.com/s/22BMv6sVZFbwKzRZmAyTxA
评论