近年来,在线教育业务蓬勃发展,业务模式和教学场景也在不断的推陈出新,新的模式和场景对直播技术提出了新的挑战,特别是沉浸式课堂教学对直播的实时性和互动性要求越来越高,作业帮运用了大量AI技术试图应对这些挑战。
深度学习是一种使用神经网络的机器学习,正迅速成为解决从文本分类到推荐系统等许多不同问题的有效工具。然而,将训练好的神经网络模型部署到应用程序和服务中可能给算法从业人员带来不小的挑战。
近年来,在众多自然语言处理模型中最具有代表性的就是 BERT,它以优异的性能赢得了广大算法工程师的青睐。
虽然目前基于 Transformers 架构的自然语言处理模型在各类工业场景落地过程中都表现出了优异的成绩,但其背后所需要的标注数据依然是日常工作中的重点,也是费时费力的瓶颈所在。
本文介绍了作业帮的 WeNet + ONNX 端到端语音识别推理方案,实验表明,相比 LibTorch,ONNX 的方案可获得 20% 至 30% 的速度提升。
沉浸式课堂教学对直播的实时性和互动性要求越来越高,传统的基于 rtmp 的直播技术已无法满足这一诉求。
作业帮研发团队借助 AI 视觉识别技术,解决孩子上网课“溜号”、“距离屏幕过近”等实际问题,让人工智能技术于在线教育场景中真正落地。
本文介绍作业帮“手势识别”AI 功能的研发过程
本文介绍作业帮的“语音弹幕”功能
“接到这个项目需求时,凭我多年做音视频的经验,就知道这个项目是一个棘手的活。”
分享了作业帮自研的 ZRTC 技术的应用发展情况。
分享了 NLP((Natural Language Processing) 技术在在线教育服务中的实践和创新。
得益于计算机技术和语音评测技术的突飞猛进,计算机辅助语言学习(Computer Assisted Language Learning)技术应运而生,各种基于人工智能技术的口语评测方案相继落地。
随着深度学习的发展以及计算能力的不断提升,基于神经网络的语音合成方案逐步成为语音合成领域的研究热点。
采用计算机辅助语言学习技术,通过检测英语学习者的发音是否正确、错误的具体原因,可以及时、高效、便捷地提供针对性的发音指导,且不受传统面授的时空限制。
在有些生产环境中,BERT 庞大的参数量不仅在推理时占用过多的计算资源,也不利于后续模型的扩展迭代。
本文介绍的是关键词即特定场景语料,在序列到序列任务中通过构建状态转移自动机的方法改善最终效果的方案。
随着语音技术开始渗透到人类生活的方方面面,混合语言的现象受到越来越多的关注。因此,开发用于中英文混合语言的自动语音识别 (CSSR) 系统尤为重要。