速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009001
用户头像

发布了 21 篇内容, 共 96202 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

媒体化战略:数字时代企业如何做好公关与内容营销

博文视点Broadview

消息推送技术-技术专题

洛神灬殇

消息推送 5月日更

组织部干部管理系统开发,智慧党建平台搭建

五月学习心得(一)

攻城先森

学习 5月日更

网络攻防学习笔记 Day9

穿过生命散发芬芳

5月日更 网络攻防

吐槽OOP

顿晓

5月日更

清华博士!教你如何快速了解JVM虚拟机,码农:天才就是不一样

牛哄哄的java大师

Java 虚拟机

如何更好地洞察用户需求?

石云升

用户分析 职场经验 5月日更

面试真题:无重复字符的最长子串

看山

面试 算法

我在InfoQ写作平台这一年

Nydia

1 周年盛典

架構設計訓練營作業 3

海罗沃德

架构实战营

NodeJs中使用Apollo Server构建GraphQL API服务

devpoint

nodejs graphql Apollo Server

私域流量这件事,古代就有了……

脑极体

部署kubernetes v1.17.3 集群

大数据技术指南

5月日更

手把手图解Git工作原理

Lujohn

git GitHub

网络攻防学习笔记 Day8

穿过生命散发芬芳

5月日更 网络攻防

模块三作业 - 消息队列系统架构设计文档

冬天的树

消息队列详细架构设计

Vincent

架构训练营

Power BI中的AI语义分析应用:《辛普森一家》

博文视点Broadview

区块链如何赋能“链”金融

CECBC

金融

杨强教授领衔撰写,国内首本联邦学习实战的权威著作

博文视点Broadview

GitHub星标数超4万的火爆之作——ElasticSearch,你值得拥有!

飞飞JAva

Java

5G+AI,智能视频的下一步怎么走?百度云智技术论坛带你一探究竟!

百度大脑

百度智能云

vue组件、路由、cli

chun1123

Vue 组件化 路由 vue cli

编程风格漫谈

顿晓

编程风格 5月日更

还是说出来吧,反正也不是外人|靠谱点评

无量靠谱

读英特尔CEO自传有感

ES_her0

5月日更

ceph-csi源码分析(5)-rbd driver-nodeserver分析(上)

良凯尔

Kubernetes 源码分析 Ceph CSI

还在“坚持”吗?|靠谱点评

无量靠谱

【LeetCode】股票的最大利润Java题解

Albert

算法 LeetCode 5月日更

我的Serverless实战——引领云计算的下一个十年

孙叫兽

云计算 Serverless #Serverless

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章