QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

吴恩达的公司发布社交距离监控工具,疫情期间别靠太近

  • 2020-04-21
  • 本文字数:1596 字

    阅读完需:约 5 分钟

吴恩达的公司发布社交距离监控工具,疫情期间别靠太近

吴恩达创立的公司 Landing AI 开发了一款社交距离监控工具,通过摄像头监控行人之间的距离,要求至少保持 6 英尺(接近两米)。

Social Distancing Detector:用机器学习监控社交距离

近日,吴恩达创立的 AI 公司 Landing AI 在其官方博客平台上发布了一款社交距离监控工具,其中包含一个演示视频,基于公开街景数据集 The Oxford Town Centre 展示了这个新的社交距离探测器。



上图源自演示视频的一个截图,当行人之间的社交距离满足要求,也就是两米(WHO 倡议人与人应保持至少 3 英尺(0.9 米)的距离,我国则建议至少 1.5 米)时,行人周围是绿框,当彼此之间的距离不符合要求时(如上图红框所示),则会出现红色提醒。


在当前危机中,减少传播的措施之一是隔离。虽然很多公司已经要求员工在家办公,但制造业等领域还有很多员工不得不继续工作,保持社交距离可能不容易被执行,这就是 Landing AI 公司创建 AI 工具来确保彼此之间保持安全距离的原因。根据介绍,Landing AI 公司的许多客户来自制造业和制药业,每天都在生产重要物品,他们的技术人员只需要将该软件集成到安全摄像头中,就可以轻松监控工作场所。

内部工作原理:校准,检测和测量

在博客文章中,Landing AI 解释了该工具的内部工作原理。


校准

由于输入视频是从透视角度拍摄的,因此第一步是利用计算将视图角度转换为鸟瞰角度(自上而下),这个过程被称作校准。由于输入帧是从单个摄像头拍摄的单眼图像,最简单的校准方法之一就是在透视图中选择四个点并将其映射到鸟瞰图中矩形的各个角上,假设每个人都站在同一平面上。以此类推,可以将这种方式应用在整个透视视图上。这种方法虽然广为人知,但想要在实际中正确应用却并不容易。因此,开发者们构建了一个轻量级工具,即使非技术用户也可以实时校准系统。


在校准步骤中,他们还考虑了鸟瞰图的比例问题,例如,在现实中,6 英尺是多少像素。



左:原始透视图,上面覆盖有校准网格;右:鸟瞰图,街道两边与绿色网格完全平行。

检测

第二步涉及将行人检测器应用到透视图上,以便能够在每个行人周围绘制边界框。为简单起见,使用基于 Faster R-CNN 的开源行人检测网络。为了清除输出边界框,使用了一些算法简化后处理程序,例如非极大值抑制(NMS)和各种基于规则的启发式算法;开发者应该基于实际生活假设来选择使用哪种规则(例如识别人时应该识别他的高度而不是宽度),这样才能最大程度降低过度拟合的风险。

测量

现在,在给定每个人边界框的情况下,在鸟瞰图中估计他们的坐标位置(X 轴、Y 轴)。由于校准步骤输出了平面图的转换,因此将上述转换应用到每个人的边界框的底部中心点,从而得出其在鸟瞰图中的位置。最后一步是计算每两人之间的鸟瞰图距离,并根据校准中估算的缩放系数来缩放距离。将低于最小可接受距离的人用红色突出标记,并在两者之间画一条线进行强调。

网友不太买账

针对该工具的推出,吴恩达第一时间在 Twitter 上发布了该消息,并受到了很多用户的关注。



评论区的态度褒贬不一,但大部分网友的评论表明他们对此并不买账,有人认为单就人眼估计短距离就足够了,也有人担心隐私问题,并认为这是技术的滥用,也有部分网友怀疑当前版本是否真的可用,还是说这仅仅是概念证明。但 Landing AI 在其官方博客称,正如医学专家所说,在获得疫苗之前,保持适当的社交距离是我们保护自己的最好的方式之一,也可有助于缓解疫情扩散并加快经济恢复的步伐。公司在早期阶段创建并共享此工具是希望能为用户提供帮助并想鼓励其他人来探索新的方法来抗击疫情。


对于隐私相关的问题,Landing AI 在文章最后进行了简单阐述,并提醒大家注意:


计算机视觉的兴起引发了有关隐私和个人权利的重要问题,我们当前的系统无法识别个人,因此我们敦促使用此系统的任何人必须公开透明且仅在知情人同意的情况下使用。


参考链接:


https://landing.ai/landing-ai-creates-an-ai-tool-to-help-customers-monitor-social-distancing-in-the-workplace/


2020-04-21 13:374342
用户头像
赵钰莹 极客邦科技 总编辑

发布了 892 篇内容, 共 663.9 次阅读, 收获喜欢 2689 次。

关注

评论

发布
暂无评论
发现更多内容

炸了,炸了!阿里P9纯手打Java面试小抄(21版)在GitHub上已获80万star

Java架构之路

Java 程序员 架构 面试 编程语言

如何批量下载YouTube视频到本地

科技猫

软件 音视频 经验分享 资源分享 工具分享

FFmpeg入门篇

Changing Lin

ffmpeg media

寻找被遗忘的勇气(十九)

Changing Lin

3月日更

2021最新总结网易/腾讯/CVTE/字节面经分享(附答案解析)

比伯

Java 编程 架构 面试 程序人生

Java面试必看!阿里(嵩山版)分布式核心原理笔记来了

Java架构追梦

Java 阿里巴巴 架构 面试 架构分布式

GO训练营第10周——日志&指标&链路追踪

Glowry

安卓嵌入式底层开发!整理出这份8万字Android性能优化实战解析,已开源

欢喜学安卓

android 程序员 面试 移动开发

冲击大厂!阿里P9纯手打Java面试小抄(21版)在GitHub上已获80万star

Java 程序员 面试

【前端面试题】关于一些js的一些面试题(金融行业),我和面试官扯了三个小时

孙叫兽

JavaScript 大前端 金融 笔试题

收藏!Linux常用命令合集

roseduan

Linux

跟我学ModelArts丨探索ModelArts平台个性化联邦学习API

华为云开发者联盟

AI 联邦学习 API 华为云 modelarts

2021 年要了解的 34 种 JavaScript 简写优化技术

LeanCloud

JavaScript 面试 大前端

LeetCode题解:213. 打家劫舍 II,动态规划(不缓存偷盗状态),JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

「面试高频」秒杀架构的设计套路,你值得拥有

我爱娃哈哈😍

架构设计 架构设计实战 秒杀架构

区块链电子发票平台,区块链电子发票优势

13530558032

快点来学吧!Android性能优化面试题集锦,深度解析,值得收藏

欢喜学安卓

android 程序员 面试 移动开发

2B营销路径: 9大步骤自我拆解

boshi

营销数字化 七日更

电子门锁没电的解决办法

孙叫兽

生活 程序人生 电子锁

GO训练营第11周——DNS&CDN&多活架构

Glowry

【LeetCode】设计停车系统Java题解

Albert

算法 LeetCode 28天写作 3月日更

源中瑞智慧社区解决方案,社区服务平台

13530558032

堪称完美!中国Java之父纯手打,阿里首发:多线程与高并发

Java架构之路

Java 程序员 架构 面试 编程语言

使用“零信任”,不惧“内部威胁”!

龙归科技

管理 数据完整性 零信任 内部威胁

我看 JAVA 之 引用类型(Reference)

awen

Java ThreadLocal Reference

EGG Network公链技术创新,EFTalk打造高效全能公链

币圈那点事

区块链

拍乐云推出“实时标注”,助力少儿编程、在线金融等行业场景实现高效互动

拍乐云Pano

音视频 在线教育 互动白板 实时标注 在线金融

看了上百份面经,发现每次面试的问题都逃不过这几方面

yes

面试

全票通过!微众开源项目EventMesh进入Apache孵化器

康月牙

Apache 开源 Event 事件网格 eventmesh

智慧党建信息管理平台系统建设

13530558032

Java 和 Python 关于 % 的那些坑

与你一起学算法

Java Python

吴恩达的公司发布社交距离监控工具,疫情期间别靠太近_AI&大模型_赵钰莹_InfoQ精选文章