2012年,ImageNet 训练数据集的正式亮相在人工智能开发领域掀起一波巨浪。在实际应用角度来看,此次浪潮带来的最引人注目的成功案例,无疑是 AI 视觉模型:在漫长的人类历史上,我们第一次创建出极为强大的机器学习(ML)模型,甚至能够以不逊于人类的准确率实现物体识别。
虽然 ImageNet 引领着目前这场 AI 革命,但除计算机视觉领域的其他研究人员却仍然没有足够的可用数据创建高质量模型——这类数据集要么难以获取、要么成本过高,甚至根本就不存在。例如,限制无人驾驶汽车发展成熟的关键因素,在于跨多种潜在驾驶场景(包括事故或极近车距制动场景)的相关数据仍然相当稀缺。很明显,我们无法通过在现实生活中重现交通事故的方式获取训练无人驾驶AI模型所必需的数据。但是,如今新的希望出现了——我们完全可以构建模拟环境,从而快速安全地完成数据收集。而这,无疑代表着一波新的变革。
因此,我们很高兴在 GCP 之上推出 Unity Simulation。这项服务将 Unity 模型在实时 3D 技术领域提供的丰富视觉效果以及模拟经验同 GCP 强大的可扩展性结合起来。Unity Technologies 公司 AI 与机器学习副总裁 Danny Lange 表示,“在 GCP 的支持下,Unity Simulation 将帮助用户以超大规模方式自动运行多个 Unity 项目实例。”
模拟类型
自上世纪诞生以来,计算机就一直被用于实现各类模拟仿真。一部分早期计算机专门用于模拟各类复杂的物理现象,包括弹道计算以及天气预测等等。时至今日,不少大型超级计算机的主要模拟场景仍然集中在化合物发现与大范围气候变化预测等领域。
在这里我要列举两种不同的模拟类型,分别为高精度科学(或者工程)模拟以及大规模概率模拟。
科学与工程模拟往往对准确率要求极高。要想理解天气的运行及变化规律,我们需要利用流体动力学进行建模,纳入温度与密度等影响因素,最终打造出一套分辨率极高的全球模型。如果项目要求设计新型涡轮风扇,我们则需要详尽分析风扇的物理特性——考虑到风扇可能在数千华氏度的环境温度下以每分钟数万转的极高速长期运行,导热系数或者材料韧性等属性可能起到至关重要的作用。此外,对于某些特定物理系统,微观与量子效应也许同样会成为不容忽视的核心影响因素。
在概率模拟当中,我们使用的现实模型本身可能较为粗糙,但需要配合大量选项。概率模拟主要采用传统的蒙特卡洛方法。在这类案例中,我们尝试模拟场景当中的一系列细微变化,以找寻趋近于正确结果的一种或者一系列解决方案。举例来说,如果我们尝试猜测特定城市街区范围内是否会出现交通拥堵,我们可以模拟包含成千上万辆汽车、与之对应的不同目的地以及行驶速度的随机场景。而且由于这类模拟场景更关注宏观结论,所以这些车辆引擎的实际物理特性可以忽略不计。
科学模拟则通常需要规模相对较小,但精度极高的数据。这类模拟流程很难构建与扩展,且可能需要搭配成本极高的专用超级计算机。另一方面,大规模概率模拟天然拥有并行特性,因此能够在云端完成高效构建与扩展。从这几个角度看,概率模拟自然就成为创建AI模型训练数据集,以及进行 AI 系统端到端测试的理想数据源。
模拟用例
模拟用例的应用范围当然不仅限于无人驾驶汽车;相反,其代表着一种新的 AI 创建范式。我们可以引入大量人类判断示例帮助AI模型学会解决某些具体问题,也可以在环境模拟方案领域实现更理想的仿真度。
目前,模拟技术最有趣的应用方向之一在于机器人训练。从基本原则出发,相较于为机器人搭设真实物理环境以供其学习,在工厂之内建立安全的数字孪生场景与编程通道,无疑才是更加轻松高效的机器人训练方式。更重要的是,对于零售仓库、特别是摆放着成千上万种商品的货架等实际场景,我们几乎不可能在无需人为介入的前提下、让机器人安全应对如此严苛的参数学习挑战。
在机器人技术之外,我们也可以在众多其他新领域内应用类似的模拟方法。在零售行业,我们可以模拟客流规律以设计店面布局。在制造业领域,我们也可利用同样的思路设计生产流水线。此外,我们也在医疗保健领域的模拟应用方向上迈出了重要的第一步。如果人类最终能够模拟细胞内各部分间的化学作用,则有望预测出新药的存在与功用。即使这些模拟无法 100% 准确,我们仍然可以利用相关结论指导新药的测试,从而节约长达数年的开发周期与高达数亿美元的研发投入。
文章版权归作者所有,未经许可不得转载。
文章信息
作者:哈维尔·托德尔 Google Cloud 技术总监
1311次阅读
2019 年 11 月 27 日 13:02