报名参加CloudWeGo黑客松,奖金直推双丰收! 了解详情
写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009296
用户头像

发布了 21 篇内容, 共 10.1 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

PoseiSwap 即将开启质押,利好刺激下 POSE通证短时涨超 30%

鳄鱼视界

JavaScript入门基础

timerring

JavaScript

车内语音识别数据:驾驶体验升级与智能出行的未来

数据堂

最高1000万元基金直投!2023年中国(宁波)创新创业大赛

科兴未来News

Java教学之空指针异常、构造方法、封装

java易二三

Java 编程 程序员 计算机

为什么我强烈建议大家使用枚举来实现单例

java易二三

编程 程序员 计算机 枚举

PoseiSwap 即将开启质押,利好刺激下 POSE通证短时涨超 30%

股市老人

如何配置 Sublime Text4为 C++ 编辑器

芯动大师

搜狐科技专访 | 澜舟科技CEO周明:不过度追求AGI,更看重大模型语言理解能力和应用落地性

澜舟孟子开源社区

精益思维在项目管理中的应用

乐思项目管理

项目管理 精益

Servlet学习:监听器、过滤器

java易二三

编程 程序员 计算机

Spring系列之HikariCP连接池

java易二三

编程 程序员 Spring Boot 计算机 spring类型转换

想学Python高级编程?这个技巧你不能错过!

程序员晚枫

Python 高级编程

3DCAT实时云渲染助力VR虚拟现实迈向成熟

3DCAT实时渲染

实时渲染云 VR虚拟现实

如何进行高效的代码审查

小万哥

程序员 程序人生 后端 软件开发 代码审查

文心一言 VS 讯飞星火 VS chatgpt (67)-- 算法导论6.5 6题

福大大架构师每日一题

福大大架构师每日一题

javascript数据类型详解

timerring

JavaScript

直播网站源码社区功能部署开发:连接世界的互动形式!

山东布谷科技

软件开发 社区 源码搭建 直播网站源码 直播网站

腾讯会议搭桥铺路

B Impact

Go 语言 select 都能做什么?

AlwaysBeta

Go golang 面试 select

数据驱动的项目管理:未来趋势

乐思项目管理

#数据分析 #项目管理

自然对话语音开启人机交互的未来之窗

数据堂

自然对话语音数据:人机交互的新纪元与挑战

数据堂

代码随想录 Day27 - 回溯(三)

jjn0703

浅析嵌入式GUI框架-LVGL

巫山老妖

嵌入式开发 LVGL FrameBuffer

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章