写点什么

谷歌 AI 和 Facebook 提出 AI 模型 QuaterNet,改善 3D 人体姿势预测

  • 2019-01-25
  • 本文字数:1079 字

    阅读完需:约 4 分钟

谷歌AI和Facebook提出AI模型QuaterNet,改善3D人体姿势预测

预测 3D 人体姿势可能不属于大多数人关注的范畴,但机器人技术、计算机图形学和其他关注运动学的领域(与物体运动有关的力学分支)却可以从能够做到这一点的系统中受益匪浅。此前,由谷歌提出的姿势预测成为应用人工智能(AI)的任务之一,但先前的相关工作遇到了一些障碍:数字关节和骨骼会向不自然的方向拉伸,特别是当关节旋转时。


幸运的是,Facebook 的人工智能研究部门,谷歌大脑和苏黎世联邦理工学院的新研究有望解决这个问题。在本周发布在 Arxiv.org 预印论文网站上的一篇论文(《基于四元数的人体运动神经网络》)中,研究人员提出了一个人工智能系统——QuaterNet,它通过将关节旋转表示为四元数的复数系统,以及惩罚关节位置错误来改善姿势生成。



正如本文的共同作者所解释的那样,循环神经网络(一种能够学习长期相关性的 AI 算法)历来被用于执行短期和长期姿态预测,而卷积神经网络 (非常擅长于分析视觉图像的算法)已成功应用于长期生成运动(从一个位置移动到另一个位置)。但由于人体姿势的固有随机性,是否能获得一个完美的模型仍然难以预测。


“人体运动是一个具有高度不确定性的随机过程,”研究人员写道。“对于一个给定的过去情景,未来会有多个可能的未来帧序列,并且不确定性会随着持续时间而增加。”


大多数模型使用转换运算符来预测先前姿势的下一个姿势。它们从摄取的记录帧中输出记录的目标帧,这在大多数情况下都很有效。但这个过程不会暴露它的错误,因此会阻阻碍它学习,以避免重蹈覆辙。



上图:AI 模型生成的姿势。


相比之下,研究人员提出的系统采用卷积神经网络,它可以查看过去的帧,通过持续将自己暴露于预测中不断学习进行长期预测。同时,损失函数(将一个或多个变量的值映射到实数上的函数)输入关节旋转并计算每个关节的位置。共同作者表示,这既改善了模型的稳定性,又减少了误差。


为了验证该模型的短期姿势预测能力,研究人员在 Human3.6M 上进行测试,这是一个开源 3D 人体姿势数据集,包含来自 7 名演员演示的 15 个动作的 360 万个人类姿势以及相应的图像。而长期生成测试评估在包含运动样本的其他数据集上进行。


在短期预测任务中,报告显示该模型在 Human3.6M 上的性能有所提升。另外,在长期姿势生成任务中,其目标是在给定平均速度和地面轨迹的情况下生成姿势序列,该模型的表现与最近的工作相比为“定性地”,同时时间和空间限制更好。


未来,QuaterNet 将扩展到其他与运动相关的任务中,例如动作识别或视频的姿势估计,以及采用“直接在四元数域中执行计算”的神经网络。


原文链接:


https://venturebeat.com/2019/01/24/facebook-and-googles-ai-generates-3d-human-poses/


2019-01-25 14:376192
用户头像

发布了 98 篇内容, 共 67.8 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

祝贺中国跳水队夺金!百度智能云挺敢做梦的人

百度大脑

人工智能 跳水队

基于深度学习的实时噪声抑制——深度学习落地移动端的范例

RTE开发者社区

人工智能 算法 移动端

墙裂推荐!四面阿里拿 offer 后,才发现师哥给的面试笔记有多强大

Java 架构 IT 计算机 知识

绝!阿里巴巴Java面试参考权威指南五月版最新开源

Java 阿里巴巴 架构 面试 IT

应届女生美团Java岗4面,一次性斩offfer,我受到了万点暴击

编程菌

程序员 面试 后端 计算机

架构训练营 模块三

小卷儿

Vue进阶(三):Axios 应用详解

No Silver Bullet

Vue axios 7月日更

阿里 P8 熬了一个月肝出这份 32W 字 Java 面试手册,在 Github 标星 31K+

Java 编程 架构 面试 IT

CRUD 程序员勿进!JDK源码剖析手册与并发编程图册,完美诠释高并发

Java 编程 程序员 IT 计算机

整合重复的初始化逻辑

喵叔

7月日更

设计消息队列存储消息数据的MySQL表格

chenmin

15年前的3篇论文,变成了万亿大生意

百度大脑

人工智能 论文

使用MLlib进行机器学习(十-下)

Databri_AI

spark 决策树 优化

深入了解Spring之Environment

邱学喆

Profile Environment PropertySource PropertySources

全网首发 20+ 互联网公司“Java 面试考点大全”,应有尽有

Java 编程 面试 IT 计算机

趣说开源|开源路线图入门攻略

SphereEx

架构实战营 毕业总结

竹林七贤

完善数字人民币发行应用机制 打造可靠金融基础设施

CECBC

偶获阿里大佬纯手码“887”页 Java 面试手册,突击学习一个月,成功跳槽阿里!

Java 编程 架构 面试 IT

模块二

Winston

架构实战营 - 模块 3 - 外包学生管理系统架构文档

雪中亮

架构实战营 #架构实战营

Vue进阶(三十):element-ui 表单验证

No Silver Bullet

Vue 7月日更 表单校验

Linux之ps命令

入门小站

Linux

模块三作业

俊杰

在线HTML转MarkDown工具

入门小站

工具

模块三

江南巴飞特

从简历被拒到收割 9 个大厂 offer,我用了 3 个月成功破茧成蝶

Java 编程 程序员 架构 计算机

都2021年了,还在问网络安全怎么入门,气得我当场脑血栓发作

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 安全漏洞

极致性能一睹为快!阿里全新出品性能优化手册 从此拒绝系统瘫痪!

Java 编程 程序员 架构师 计算机

某宝付费的Redis核心原理深度实践PDF,竟在GitHub标星86k+霸榜

白亦杨

Java 编程 程序员 架构师 计算机

仅仅上线一小时,下载量就破10W!阿里内部Java性能优化实战手册

Java 编程 程序员 面试 IT

谷歌AI和Facebook提出AI模型QuaterNet,改善3D人体姿势预测_AI&大模型_KYLE WIGGERS_InfoQ精选文章