写点什么

作业帮直播课“手势识别”功能研发实践

  • 2021-02-28
  • 本文字数:1063 字

    阅读完需:约 3 分钟

作业帮直播课“手势识别”功能研发实践

只要对着屏幕竖起拇指,不到 1 秒,屏幕上便会回应同样的手势,完成一次“点赞”。这是“手势识别”AI 功能带给用户的互动体验。在作业帮直播课“小组直播间”中,“手势识别”功能收获一众“粉丝”,成为学生互动满意度最高的功能,本文介绍了该功能的研发过程。


项目需求

作业帮小学产品负责人曹越发现,师生间的肢体互动是活跃课堂气氛、提升上课效率的有效手段。尤其在“小组直播间”双向视频的模式下,由于师生间可以互相看见,类似的互动变得更加高频,一节课大约有 5~6 次。


与此同时,曹越也发现了“即时反馈缺失”带来的问题。“有时候老师让孩子给自己点个赞,点赞之后老师没有说把手放下,有的孩子可能就会一直举着,因为他们不确定老师是不是看见了自己的点赞。”


一位主讲老师同时面对数千甚至上万学生的课堂,有限的精力无暇回应每一位学生。是否能有这样一个功能,让学生的每一次参与都被感知,每一次互动都被回应?借助 AI 能力回应小学生在课堂上的互动行为,“手势识别”功能的需求被提出。

研发过程

作业帮智能技术实验室负责人王岩团队接到了这一需求。最初,在产研团队和主讲老师的头脑风暴环节,大概提出了 15-20 种手势,单手和双手都有。“产品要贴近应用,小朋友不理解的和老师上课用不到的,做了也没用。”王岩说。最后,根据老师课堂实用性,保留了点赞、比心、OK 等常用手势。


但在功能落地过程中,难点也随之而来。小朋友比划的形式、角度等都会影响识别的准确率,这就需要前期尽可能多地收集样本素材,更准确地定义各个手势。


针对每个手势,技术都会内部先录制一版 demo。因为要确定手势是否贴合小朋友的习惯,需要模拟孩子上课的视角。为此,技术老师编写了一个小程序。然后,一群程序员,聚在办公室里,打开手机前置摄像头,跟着自己编写的小程序,模仿小朋友做出各种比心、点赞的手势。


初版 demo 完成后,负责产品的聂靖骐开始在灰度测试中收集小朋友手势,总共发起 4-5 次收集。“由主讲老师在课中进行引导,让学生比出点赞、比心等手势。然后,根据各种手势的占比多少进行取舍。”最后,有近万名学生的 2000 多种手势被收录到系统中。


2020 年初,随着“小组直播间”的正式上线,手势识别的功能也被应用到课堂上。2020 年暑期,在小组直播间功能升级调研中,手势识别成为小学生互动满意度最高的功能,有 77.14%的小学生表示,非常满意,平均满意度达 4.7 分(满分 5 分)。


借助 AI 技术,作业帮让在线课堂活跃起来,变得更加有趣。对于接下来的规划,聂靖骐仍希望这项功能更好地应用到教学场景。“朝着这个方向,我们会继续丰富手势和提高识别准确率,为老师和学生带来更丰富的体验。”

2021-02-28 10:006357

评论 3 条评论

发布
用户头像
dcfvdsgvsdfdsfdsfds
2021-03-03 03:30
回复
用户头像
😓
2021-02-28 13:05
回复
没有更多了
发现更多内容

恒源云(GpuShare)_租卡怎么选?看这一篇就够了!

恒源云

人工智能 GPU服务器

无监控不运维—浅述各种监控方案使用场景

穿过生命散发芬芳

3月月更

手把手教你从Apk中取出算法

奋飞安全

android 安全 java

windows下C与C++执行cmd命令并实时获取输出

DS小龙哥

3月月更

产品升级|1-2月合刊:多款重磅产品来袭

百度大脑

从0到1落地电商小程序之微服务设计

晨亮

「架构实战营」

提升客户服务体验的技巧

小炮

客户服务 SaaS平台

地狱开局的2022,穿好你的安全铠甲

脑极体

详细的网站定制步骤有哪些?

源字节1号

网站开发 软件定制

【愚公系列】2022年03月 Docker容器 Kafka集群的搭建

愚公搬代码

3月月更

浅谈信息熵在数字体验监控领域的应用

博睿数据

客户画像赋能百度推广生态实践

百度Geek说

前端 后端

Kubernetes中API的不同版本, Alpha, Beta, Stable 都是什么?

工程师薛昭君

Kubernetes API

什么是数据恢复?数据丢失的最常见原因有哪些?

Ethereal

从建好到用好,阿里云原生微服务生态的演进

阿里巴巴云原生

Java AOT之GraalVM native image介绍以及简单长连接服务实践

BUG侦探

GraalVM java aot native image

Apache ShardingSphere 5.1.0 执行引擎性能优化揭秘

SphereEx

数据库 ShardingSphere SphereEx apache 社区

自动化知识图谱表示:从三元组到子图

第四范式开发者社区

人工智能 自动化 知识图谱

治理有精度,AI赋智加强城市精细化管理

百度大脑

Python 的排序方法 sort 和 sorted 的区别

AlwaysBeta

Python

你的“数学潜意识”原来可以被唤醒!

博文视点Broadview

错误码设计思考

木小风

Java 架构 错误码

AI+遥感智能解译,赋能智慧城市规划革新

百度大脑

Nginx限速模块初探

喀拉峻

nginx

网络安全入门5天速成教程: WEB安全渗透攻防技术

网络安全学海

网络安全 安全 信息安全 渗透测试 WEB安全

弱监督语义分割:从图像级标注快进到像素级预测

网易云信

安全

Go 中的空白标识符(下划线)

宇宙之一粟

Go 语言 3月月更

延期通知 RocketMQ Summit 议题全揭秘

阿里巴巴云原生

国家产业政策不断加码,氢能步入加速发展期

易观分析

氢能源 氢能源产业

TDesign React Starter 发布

TDesign

企业如何挖掘知识“金矿”?这本白皮书讲得够透彻!

百度大脑

作业帮直播课“手势识别”功能研发实践_AI&大模型_筱澍_InfoQ精选文章