2025 年技术指引:让真实案例和经验为开发者开路 了解详情
写点什么

谷歌 AI 和 Facebook 提出 AI 模型 QuaterNet,改善 3D 人体姿势预测

  • 2019-01-25
  • 本文字数:1079 字

    阅读完需:约 4 分钟

谷歌AI和Facebook提出AI模型QuaterNet,改善3D人体姿势预测

预测 3D 人体姿势可能不属于大多数人关注的范畴,但机器人技术、计算机图形学和其他关注运动学的领域(与物体运动有关的力学分支)却可以从能够做到这一点的系统中受益匪浅。此前,由谷歌提出的姿势预测成为应用人工智能(AI)的任务之一,但先前的相关工作遇到了一些障碍:数字关节和骨骼会向不自然的方向拉伸,特别是当关节旋转时。


幸运的是,Facebook 的人工智能研究部门,谷歌大脑和苏黎世联邦理工学院的新研究有望解决这个问题。在本周发布在 Arxiv.org 预印论文网站上的一篇论文(《基于四元数的人体运动神经网络》)中,研究人员提出了一个人工智能系统——QuaterNet,它通过将关节旋转表示为四元数的复数系统,以及惩罚关节位置错误来改善姿势生成。



正如本文的共同作者所解释的那样,循环神经网络(一种能够学习长期相关性的 AI 算法)历来被用于执行短期和长期姿态预测,而卷积神经网络 (非常擅长于分析视觉图像的算法)已成功应用于长期生成运动(从一个位置移动到另一个位置)。但由于人体姿势的固有随机性,是否能获得一个完美的模型仍然难以预测。


“人体运动是一个具有高度不确定性的随机过程,”研究人员写道。“对于一个给定的过去情景,未来会有多个可能的未来帧序列,并且不确定性会随着持续时间而增加。”


大多数模型使用转换运算符来预测先前姿势的下一个姿势。它们从摄取的记录帧中输出记录的目标帧,这在大多数情况下都很有效。但这个过程不会暴露它的错误,因此会阻阻碍它学习,以避免重蹈覆辙。



上图:AI 模型生成的姿势。


相比之下,研究人员提出的系统采用卷积神经网络,它可以查看过去的帧,通过持续将自己暴露于预测中不断学习进行长期预测。同时,损失函数(将一个或多个变量的值映射到实数上的函数)输入关节旋转并计算每个关节的位置。共同作者表示,这既改善了模型的稳定性,又减少了误差。


为了验证该模型的短期姿势预测能力,研究人员在 Human3.6M 上进行测试,这是一个开源 3D 人体姿势数据集,包含来自 7 名演员演示的 15 个动作的 360 万个人类姿势以及相应的图像。而长期生成测试评估在包含运动样本的其他数据集上进行。


在短期预测任务中,报告显示该模型在 Human3.6M 上的性能有所提升。另外,在长期姿势生成任务中,其目标是在给定平均速度和地面轨迹的情况下生成姿势序列,该模型的表现与最近的工作相比为“定性地”,同时时间和空间限制更好。


未来,QuaterNet 将扩展到其他与运动相关的任务中,例如动作识别或视频的姿势估计,以及采用“直接在四元数域中执行计算”的神经网络。


原文链接:


https://venturebeat.com/2019/01/24/facebook-and-googles-ai-generates-3d-human-poses/


2019-01-25 14:375845
用户头像

发布了 98 篇内容, 共 64.6 次阅读, 收获喜欢 285 次。

关注

评论

发布
暂无评论
发现更多内容

HDFS SHELL详解(1)

罗小龙

hadoop 28天写作 hdfs shell

第2周课后练习-OOD的五大原则

潘涛

架构师训练营 4 期

写在再次学习python之前-why篇

赵开忠

Python 28天写作

CSS10 - 盒子模型&常用无序列表样式

Mr.Cactus

html/css

28天带你玩转Kubernetes--第一天(课程介绍)

Java全栈封神

Kubernetes 云原生 k8s入门 28天写作 k8s教程

序言 基层管理者技能修炼的九把刀

一笑

管理 28天写作

视频号发展简史&第一天数据 | 视频号28天(02)

赵新龙

28天写作

职业成长就是一个逐渐“变帅”的过程

L3C老司机

区块链的前世今生(1)

抗哥

关系中的密码:麻烦

熊斌

个人成长 28天写作 亲密关系

生产环境全链路压测建设历程 24:FAQ 5、6负载均衡、如何不影响正常业务?

数列科技杨德华

28天写作

自下而上的问题清单

将军-技术演讲力教练

28天写作

我们为什么要学习Springboot?

武哥聊编程

Java springboot SpringBoot 2 28天写作

架构师训练营大作业(二)

曾彪彪

「架构师训练营第 1 期」

架构师训练营第 1 期 - 大作业1

Anyou Liu

架构师训练营第 1 期

SpringBoot系列1——概述和快速入门

程序员的时光

springboot 七日更 28天写作

SafePoint 与 Stop The World 全解(基于OpenJDK 11版本)

AI乔治

Java 架构 jdk JVM

kill -9 导致 kafka 重启失败的惨痛经历!

AI乔治

Java kafka 架构

我能加入写作训练营,一切都因为...

李忠良

个人成长 驱动力量 28天写作

架构师训练营大作业(一)

曾彪彪

「架构师训练营第 1 期」

架构师训练营第 1 期 - 第 12 周 - 命题作业

wgl

架构师训练营第 1 期

三只猫

Flink 自定义Avro序列化(Source/Sink)到kafka中

大数据老哥

大数据 flink hadoop

第2周总结-架构中的设计模式

潘涛

架构师训练营 4 期

28天瞎写的第二百一二天:一次删库没跑路的故事

树上

28天写作 删库

【Node.js】静态页面和简单的路由

德育处主任

大前端 Node 28天写作

记一次JVM OOM 实战优化

AI乔治

Java 架构 JVM OOM

小心!你可能搞了个假的头脑风暴!

Justin

团队协作 28天写作 头脑风暴 群体迷思 创造性思维

学创业,读毛选 Jan 9, 2021

王泰

28天写作 读毛选,学创业

解读《Java开发手册(泰山版)》- 会当凌绝顶,一览众山小

xcbeyond

Java Java开发手册 28天写作

【计算机内功修炼】三:一文彻底理解IO多路复用

码农的荒岛求生

epoll

谷歌AI和Facebook提出AI模型QuaterNet,改善3D人体姿势预测_AI&大模型_KYLE WIGGERS_InfoQ精选文章