写点什么

作业帮直播课“手势识别”功能研发实践

  • 2021-02-28
  • 本文字数:1063 字

    阅读完需:约 3 分钟

作业帮直播课“手势识别”功能研发实践

只要对着屏幕竖起拇指,不到 1 秒,屏幕上便会回应同样的手势,完成一次“点赞”。这是“手势识别”AI 功能带给用户的互动体验。在作业帮直播课“小组直播间”中,“手势识别”功能收获一众“粉丝”,成为学生互动满意度最高的功能,本文介绍了该功能的研发过程。


项目需求

作业帮小学产品负责人曹越发现,师生间的肢体互动是活跃课堂气氛、提升上课效率的有效手段。尤其在“小组直播间”双向视频的模式下,由于师生间可以互相看见,类似的互动变得更加高频,一节课大约有 5~6 次。


与此同时,曹越也发现了“即时反馈缺失”带来的问题。“有时候老师让孩子给自己点个赞,点赞之后老师没有说把手放下,有的孩子可能就会一直举着,因为他们不确定老师是不是看见了自己的点赞。”


一位主讲老师同时面对数千甚至上万学生的课堂,有限的精力无暇回应每一位学生。是否能有这样一个功能,让学生的每一次参与都被感知,每一次互动都被回应?借助 AI 能力回应小学生在课堂上的互动行为,“手势识别”功能的需求被提出。

研发过程

作业帮智能技术实验室负责人王岩团队接到了这一需求。最初,在产研团队和主讲老师的头脑风暴环节,大概提出了 15-20 种手势,单手和双手都有。“产品要贴近应用,小朋友不理解的和老师上课用不到的,做了也没用。”王岩说。最后,根据老师课堂实用性,保留了点赞、比心、OK 等常用手势。


但在功能落地过程中,难点也随之而来。小朋友比划的形式、角度等都会影响识别的准确率,这就需要前期尽可能多地收集样本素材,更准确地定义各个手势。


针对每个手势,技术都会内部先录制一版 demo。因为要确定手势是否贴合小朋友的习惯,需要模拟孩子上课的视角。为此,技术老师编写了一个小程序。然后,一群程序员,聚在办公室里,打开手机前置摄像头,跟着自己编写的小程序,模仿小朋友做出各种比心、点赞的手势。


初版 demo 完成后,负责产品的聂靖骐开始在灰度测试中收集小朋友手势,总共发起 4-5 次收集。“由主讲老师在课中进行引导,让学生比出点赞、比心等手势。然后,根据各种手势的占比多少进行取舍。”最后,有近万名学生的 2000 多种手势被收录到系统中。


2020 年初,随着“小组直播间”的正式上线,手势识别的功能也被应用到课堂上。2020 年暑期,在小组直播间功能升级调研中,手势识别成为小学生互动满意度最高的功能,有 77.14%的小学生表示,非常满意,平均满意度达 4.7 分(满分 5 分)。


借助 AI 技术,作业帮让在线课堂活跃起来,变得更加有趣。对于接下来的规划,聂靖骐仍希望这项功能更好地应用到教学场景。“朝着这个方向,我们会继续丰富手势和提高识别准确率,为老师和学生带来更丰富的体验。”

2021-02-28 10:006510

评论 3 条评论

发布
用户头像
dcfvdsgvsdfdsfdsfds
2021-03-03 03:30
回复
用户头像
😓
2021-02-28 13:05
回复
没有更多了
发现更多内容

适合新手进行接口与自动化测试练习的推荐网站!!!

EquatorCoco

接口 自动化测试

天融信与涛思数据达成战略合作,共筑数据安全新高地

TDengine

从闪存普惠,到数字化普惠:极简全闪数据中心引发的变革

脑极体

AI

总有坏人想爬我网站的数据,看我用这 10 招干他!

快乐非自愿限量之名

爬虫 网站

按需扩展,成本优化:灵活的服务配置

可观测技术

成本优化

代理IP在社媒营销中的重要作用

IPIDEA全球HTTP

K8S集群中使用JDOS KMS服务对敏感数据安全加密

京东科技开发者

清晰易懂二分查找算法 你确定不看吗?

不在线第一只蜗牛

Java Python 算法

科大讯飞哪一款适合初高中 科大讯飞T20Pro值得买吗

妙龙

学习机

MySQL5.7 中连续 Crash 引发 GTID 丢失

爱可生开源社区

MySQL 数据库

个人开源项目商业化经验分享

秦少卫

开源图片编辑器 开源vue图片编辑器 vue图片编辑器

2024 年 7 月公链行业研报:市场波动中 Solana 表现抢眼,Layer 2 竞争白热化

Footprint Analytics

比特币 以太坊 公链 #区块链

Elasticsearch Mapping类型修改

京东科技开发者

观测云:技术创新与敏捷迭代的先锋

可观测技术

数据分析

共情财务业务一体化管理,成为企业合作伙伴的拥护者

智达方通

企业管理 企业转型 全面预算管理 财务管理 财务转型

IPLC、IEPL与MPLS的对比分析

Ogcloud

MPLS 企业组网 企业网络 IPLC IEPL

告别杂音,从 AI 音频降噪开始

七牛云

AI降噪

首部顶级AI科学家创作的纯正科幻小说,一个元宇宙和AI时代的全新科学幻想!

博文视点Broadview

2024快应用开发者大会:携手AI,共筑未来智慧服务新生态

科技热闻

10亿数据秒级查询,西南证券与镜舟科技合作,构建极速、高效数据平台

镜舟科技

数据库 大数据 数据分析 StarRocks

在一串字符串中Java使用正则匹配电话号码的方法

EquatorCoco

Java MySQL 开发语言

科大讯飞AI学习机P30 值得入手吗 功能介绍

妙龙

华为大咖说丨当“AI大潮”来袭时,你是否还在“裸泳”?

华为云PaaS服务小智

人工智能 华为云

万界星空科技自动化运维管理---设备管理

万界星空科技

数据采集 mes 自动化运维 设备管理 万界星空科技

SDN与SD-WAN的交集和区别

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

全栈监控:一目了然的 IT 管理

可观测技术

监控

音乐制作工具:Studio One 6 (Win&Mac) 激活版

你的猪会飞吗

Studio One 许可证 Studio One 破解 Studio One 6下载

关于低代码这一技术的杂谈

秃头小帅oi

从概念到落地:全面解析DApp项目开发的核心要素与未来趋势

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

【原创】【深入浅出系列】之代码可读性

京东科技开发者

持续迭代:观测云的产品进化论

可观测技术

持续迭代

作业帮直播课“手势识别”功能研发实践_AI&大模型_筱澍_InfoQ精选文章