写点什么

Facebook 打造第一视角视频数据集 Ego4D:捕获超 3000 小时镜头,剑指下一代 AI

  • 2021-10-22
  • 本文字数:1588 字

    阅读完需:约 5 分钟

Facebook打造第一视角视频数据集Ego4D:捕获超3000小时镜头,剑指下一代AI

据了解,Ego4D 是目前最大的第一视角日常活动视频数据集。

第一视角视频数据集 Ego4D


近日,Facebook 公布了一项名为 Ego4D 的研究项目。该项目为 Facebook 与全球 13 所大学和实验室合作项目,通过收集第一人称镜头,以训练下一代人工智能模型。


信息显示,Ego4D 数据集包含超过 3025 个小时的视频,由来自 9 个国家(美国、英国、印度、日本、意大利、新加坡、沙特阿拉伯、哥伦比亚和卢旺达)73 个不同地点录制的视频组成,总录制人数达 855 人。据了解,这些参与者拥有不同的年龄和背景,有些人是因其有趣的职业而被招募过来,例如面包师、机械师、木匠和园艺师。



这也是目前最大的第一视角日常活动视频数据集,在此之前,最大的第一视角视频数据集由人在厨房里 100 个小时的镜头组成。此外,以前的数据集通常由只有几秒钟的半脚本视频剪辑组成,而 Ego4D 的参与者一次佩戴头戴式摄像头长达 10 小时,并拍摄无脚本日常活动的第一人称视频,包括沿街散步、阅读、洗衣、购物、与宠物玩耍、玩棋盘游戏和与其他人互动。一些镜头还包括音频、有关参与者注视焦点位置的数据以及同一场景的多个视角。



收集到视频后,卢旺达的工作人员总共花费了 25 万个小时观看数千个视频剪辑,并编写数百万个描述拍摄场景和活动的句子。这些视频能够帮助人工智能理解或识别现实世界或虚拟世界中的某些事物,人类也可以通过一副眼镜或 Oculus 耳机从第一人称视角看到这些事物。


纽约石溪大学和谷歌大脑的计算机视觉研究员 Michael Ryoo 表示:“这个数据集里的视频更接近人类所观察的世界,这在同类数据集中是第一个。”


值得一提的是,研究人员还列出了该项目的五大挑战:


  • 情景记忆:我的 X 在哪里?

  • 手与物体交互:物体在交互过程中如何变化?

  • 视听日记:谁说了什么,什么时候说的?

  • 社会交互:谁在与谁交互?

  • 预测:接下来会发生什么?


Facebook 首席研究科学家 Kristen Grauman 在接受 CNBC 采访时表示,“这次发布的是一个开放数据集和研究挑战,它能促进我们内部和学术界外部进步,其他研究人员可以支持这些新问题,以更有意义、更大规模的方式共同解决它”。


据 Grauman 介绍,该数据集可以部署在 AI 模型中,用于训练机器人等技术以更快地了解世界。“在过去,机器人通过在自己做事来进行学习,现在,它们有机会根据人类经验从视频中学习。”


Facebook 表示,Ego4D 数据集将在 2021 年 11 月底之前提供下载。

隐私问题引担忧


Ego4D 数据集虽然给下一代人工智能带来了更多的想象空间,但也不可避免地引发人们对于隐私问题的担忧。Grauman 坦言:“在做 Ego4D 项目时,我们也意识到有一些隐私方面的工作需要做,尤其是当将隐私从探索性研究领域带出融入到产品中时。”


Facebook 表示,只有在征得参与者同意后,数据才会包含面部和其他识别信息。同时,出于隐私考虑,对于大多数视频,数据已在发布前进行了去标识化处理,如已从视频中删除了个人身份信息,并模糊了旁观者的面部和车牌号码,此外,许多视频中的音频也被删除了。


面对质疑,Facebook 的发言人称,该公司预计将来会进一步引入隐私保护措施,“Ego4D 纯粹是为了促进更广泛科学界进步的研究,我们今天没有任何关于产品应用或商业用途的分享。”


伴随着人工智能技术快速发展,隐私问题一直是大家讨论的焦点。人工智能在获取和处理海量信息数据,不可避免会涉及个人隐私保护这一重要伦理问题,并且隐藏着不容忽视的隐私泄露风险。


当前,国内外都颁布了相应的法规保护用户隐私与数据安全。比如在欧洲,2018 年生效的《通用数据保护条例》(General Data Protection Regulation,GDPR)对个人数据的收集和使用进行了规范。数据保护条例并没有明确提及人工智能或机器学习,但对个人数据的大规模自动处理和自动决策非常重视。这意味着,凡是人工智能使用个人数据的地方,都属于该条例的范围,皆适用 GDPR 原则。


而至于 Facebook 的 Ego4D 数据集未来会在隐私保护上交出怎样的答卷,一切交给时间。

2021-10-22 13:585800

评论

发布
暂无评论
发现更多内容

你知道什么是“XY Problem”吗?-【避坑指南】

炜娓道来程序人生

架构 职场 沟通 工作哲学 思维

开源7天Github斩获4.5万Stars!阿里2023版高并发设计实录鲨疯了

Java你猿哥

Java 面试 高并发 面经 春招

【直播回顾】数字化转型成为银行业发展的关键(上)

易观分析

金融 银行 经济

一个前端大佬的十年回顾 | 漫画前端的前世今生

京东科技开发者

JavaScript html 前端 京东云 企业号 4 月 PK 榜

微前端项目部署方案

京东科技开发者

微前端 京东云 企业号 4 月 PK 榜

从0到1构建基于自身业务的前端工具库

京东科技开发者

前端 京东云 企业号 4 月 PK 榜

如何成为一名数据分析师(一)——面试准备

Data 探险实验室

数据分析 数据 数据可视化 数据分析师

聊聊ChatGPT

炜娓道来程序人生

AI ChatGPT

玩转Github:三分钟教你如何用 Github 快速找到优秀的开源项目

Java你猿哥

Java GitHub 开源 源码 ssm

首次公开!阿里巴巴内部Java 面试突击核心讲(1658 页),转载 40W+

Java你猿哥

Java 面试 ssm 面经 java核心知识

绝了!阿里大佬的"Redis深度核心笔记",从基础到源码,全是精华

Java你猿哥

Java redis 面试 面经 春招

使用 App Store Connect API v2.3 管理 App Store 新定价机制

37手游iOS技术运营团队

ios iap In App Purchase App Store Connect API app store

JWT 实现登录认证 + Token 自动续期方案,这才是正确的使用姿势!

Java你猿哥

Java ssm 架构师 Token JWT

Redis缓存高可用集群

京东科技开发者

redis 云计算 redis哨兵 京东云 企业号 4 月 PK 榜

阿里P8架构师3年心血终成的453页神级Java系统分析与架构设计文档

Java你猿哥

Java ssm 架构师 面经 Java系统性能

Apache IoTDB v1.1.0 发布|增加多种分段方式与实用函数,引入 pipeline 执行引擎进一步提升查询速度

Apache IoTDB

4月飞桨国赛火热报名中!产业级赛题和免费硬件,等你来拿

飞桨PaddlePaddle

飞桨

OpenHarmony标准系统开机时长优化

OpenHarmony开发者

OpenHarmony

极光笔记 | 如何在Shopify中使用EngageLab (下)

极光JIGUANG

市场营销 用户运营

selenium源码通读·2 | common/exceptions.py异常类

Python 源码 测试 自动化测试 selenium

带你揭开神秘的javascript AST面纱之AST 基础与功能

京东科技开发者

JavaScript 前端 AST 京东云 企业号 4 月 PK 榜

MySQL中,SQL 查询总是先执行SELECT语句吗?

Java你猿哥

Java MySQL sql ssm

GreatSQL社区月报 | 2023.03

GreatSQL

greatsql greatsql社区

软件测试丨河南工业大学“火焰杯”软件测试开发选拔赛颁奖仪式

测试人

文本处理流程:Text Workflow 1.5.1直装版

真大的脸盆

文本处理 处理文本 文本管理工具

科学的演变:从笛卡尔到生成式人工智能

Baihai IDP

人工智能 AIGC 企业号 4 月 PK 榜

GitHub登顶的 Java 面试八股文(2023最新)附答案详解

采菊东篱下

Java 编程

从Spring的AOP看Synchronized锁失效和事务失效的情况

Java你猿哥

spring ssm synchronized Java工程师

软件测试丨ChatGPT的火爆对测试人员来说,是机遇还是挑战?

测试人

软件测试 ChatGPT

期盼已久的“库权限”来了

NineData

数据库 安全 数据 开发 权限管理

selenium源码通读·3 | 从源码看引入webdriver包的原因

Python 源码 测试 自动化测试 selenium

Facebook打造第一视角视频数据集Ego4D:捕获超3000小时镜头,剑指下一代AI_AI&大模型_凌敏_InfoQ精选文章