AICon 上海站|90%日程已就绪,解锁Al未来! 了解详情
写点什么

苹果如何使用神经网络在点云中做对象检测

  • 2017-12-19
  • 本文字数:1077 字

    阅读完需:约 4 分钟

苹果发明了一种神经网络系统,可以从由 LIDAR 传感器生成的点云中分离出对象。

不久之前,苹果进军无人驾驶领域。不过,关于他们的汽车,我们了解的并不多。许多正在研发自动驾驶汽车的公司都使用所谓的 LIDAR 来检测汽车周围的障碍物。LIDAR 发出光脉冲,并测量该脉冲返回传感器的时间,然后就可以计算出汽车与附近的障碍物之间的距离。旋转传感器就可以测得传感器周围的所有障碍物。

LIDAR 获得的距离存储在所谓的“点云(Point Cloud)”中。在将这个点集可视化之后,人类可以很轻松地检测出这些点云中各种类型的对象,如人、汽车、自行车。遗憾地的是,对计算机而言,这仍然是一项困难的工作。读者可以试着指出上图中的人和汽车。

传统方法依靠人工编制的特性赋予这些数据意义。例如,将云分割成子云的方法,或者将点云分离成平面的方法。还有一种让 LIDAR 数据有意义的方式是选择一个观察点,把图像输入已有的计算机视觉算法。这些方法的缺点是特性设计非常困难,而且也很难设计出可以很好地概括所有情况的特性。现在,苹果创建了一种端到端的神经网络来解决这个问题。这种方法不依赖任何手工编制的特性或神经网络之外的其他机器学习方法。

该方法的第一部分是所谓的“特性学习网络”。苹果把这个空间分解成所谓的三维像素(3D 像素)。在检测汽车时,他们将每个三维对象的尺寸设定为2 米高、2.4 米宽(这样,一辆汽车就可以很好地匹配到一个三维像素里去)。在每个三维像素里,他们随机选取一个点的子集(有些三维像素包含许多点,有些只包含几个,这样处理之后,每个三维像素包含同样数量的神经网络输入)。他们把这个点的子集输入到神经网络,在一个128 维的空间里创建一个表示。

对这个空间里每一个点都进行这样的处理,就得到一个数据结构,让你可以通过在神经网络方法中看到的相同的网络结构输入到计算机视觉算法。通过多个卷积层,神经网络把输出投射成一张概率图和一种回归图(如下图所示)。概率图说明了这个空间中的每个三维像素是否包含对象。回归图说明了每个三维像素中对象的位置。

苹果使用KITTI Vision 基准测试测试了他们的方法,并把他们的方法和其他使用类似数据的方法进行了比较,不过,有些方法使用了人工编制的特性。结果表明,与所有现有的方法相比,包括使用了人工编制的特性的方法,他们的方法性能更好。

通过这项研究,苹果展示了他们在自动驾驶项目中使用的方法。今年有报道称,苹果使用了车顶上总计12 个LIDAR 传感器中的6 个。他们在一篇论文里发布了他们的结果,感兴趣的读者可以从ArXiv 下载

查看英文原文 How Apple Uses Neural Networks for Object Detection in Point Clouds

2017-12-19 18:001506
用户头像

发布了 1008 篇内容, 共 411.2 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

【YashanDB知识库】oracle与yashanDB的jdbc返回常量列"0.00"的精度和刻度不一致

YashanDB

数据库 yashandb

VMware Fusion Pro 12 Mac vm虚拟机激活版

Rose

Office 2021 LTSC 专业最新激活版-mac/win

Rose

XMind 思维导图 2024下载安装 - mac/win

Rose

阿里p8面试官狂推的java面试神器!jvm与多线程面试80问!

程序员高级码农

Java 程序员 JVM 多线程 java面试

帮助用户与 AI 实时练习口语,Speak 为何能估值 10 亿美元?丨Voice Agent 学习笔记

声网

专业的终端SSH工具 SecureCRT for mac 最新许可证分享

Rose

Cornerstone for Mac SVN管理工具 永久激活版

Rose

7thonline第七在线荣耀加冕:获2024千峰奖“产业互联网百强”

第七在线

Parallels Desktop 19 for Mac密钥:PD永久授权

Rose

鸿蒙NEXT开发案例:保质期计算

zhongcx

flstudio2024中文免费版下载安装教程,FL Studio激活码补丁注册码永久免费使用

阿拉灯神丁

编曲软件 FL Studio 激活码生成器 FL Studio2024

百度 SEO:不是玄学,是科学与艺术的 “恋爱”

恩爸编程

搜索引擎 百度 SEO 百度搜索 SEO 优化

2025年最新Java八股文面试题,面试应该是够用了(吊打面试官)

Summer

Java 程序员 面试 面试题 架构师

探索《Crypto Rumble》 游戏:经济模型篇

股市老人

🔥httpsok-v1.18.0-SSL证书自动续期

物有本末

nginx SSL证书 (SSL)/TLS HTTPSOK

淘宝天猫商品评论数据接口丨淘宝API实时接口指南

tbapi

淘宝API接口 天猫API接口 淘宝商品评论接口 天猫商品评论接口

DevOps 体系搭建稳定后,DevOps 团队发展方向如何?

思码逸研发效能

DevOps 研发效能 研发效能度量 研发效能管理 思码逸

高效精准经营决策,智能财务的全景洞察与分析监控

用友智能财务

高效 企业 财务 会计

Autodesk AutoCAD 2021 for mac中文永久密钥及安装教程

Rose

【YashanDB知识库】UNDO表空间膨胀怎么处理

YashanDB

数据库 yashandb

阿里大佬带你一周刷完Java面试八股文,比刷视频效果好多了!

Summer

Java 编程 面试 架构师 大厂

Doris Summit 2024年度盛会|NineData创始人&CEO叶正盛将出席,围绕「数据实时同步技术实践」展开主题演讲

NineData

NineData Doris Summit Asia 2024 飞轮科技

SEO:网站的“流量秘籍”大公开

恩爸编程

搜索引擎 SEO SEO伪静态 SEO工具 SEO 优化

苹果如何使用神经网络在点云中做对象检测_Apple_Roland Meertens_InfoQ精选文章