写点什么

Mozilla “Common Voice” 开源语音识别项目

  • 2017-07-31
  • 本文字数:654 字

    阅读完需:约 2 分钟

语音识别技术可能会彻底改变我们与机器的交互方式,但通常技术开发代价昂贵,而且有专利上的使用限制。大多数语音识别技术都被封锁在少数的大公司内。Mozilla 认为这样会阻碍创新,因此它发起了“Common Voice”这一开源语音识别项目。

在“Common Voice”项目中,你可以捐献语音到一个大型数据库里,这些语音会被用于构建开源的语音识别引擎,任何人都可以访问这些数据从而轻松又快速地训练基于语音的应用程序。通过“Common Voice”,程序员们可以开发很多有趣的应用程序,如实时语音翻译、基于语音的管理助手等等。用户也可以帮助验证语音,根据显示的文本判断听到的语音是否正确,该判断结果也会被用于改进语音识别模型。

Mozilla 计划从 2017 年六月份开始收集总时长约 10,000 个小时的语音(这是训练一个语音文本转换系统所需要的数据量),之后会开源语音数据库。目前的源文本来自人们的捐献,以及一些公开的电影剧本,如电影“风云人物”(It’s a Wonderful Life)。考虑到实际生活中人们的语音变化多样,Mozilla 希望能收集到多样化的语音,让语音识别引擎能够准确无误地处理不同场景下的语音,比如带有背景对话声、汽车噪音、风扇噪音的场景。在将来,Mozilla 有可能会将该语音识别引擎集成到 Firefox 中。

该项目在 Github 上的链接: https://github.com/mozilla/voice-web

查看英文原文: Project Common Voice


感谢蔡芳芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-31 19:009141
用户头像

发布了 21 篇内容, 共 98035 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

ElasticSearch集群灾难:别放弃,也许能再抢救一下 | 京东云技术团队

京东科技开发者

榜样中国·传媒大奖2023信创力量评选结果发布!MIAOYUN获评“信创企业TOP30”!

MIAOYUN

信创 信创云 信创产业 信创生态 信创适配

adobe pdf下载破解版 内置Acrobat pro Dc 2023激活补丁

Rose

PDF编辑 Adobe Acrobat Pro DC下载 Adobe Acrobat Pro DC破解

最常用的4种光纤接口结构

小齐写代码

Led显示屏同步和异步控制的原理是什么

Dylan

控制 LED显示屏 全彩LED显示屏 led显示屏厂家

如何在不影响业务的前提下执行大批量数据变更操作?

NineData

sql 数据 dba DML 阻塞

代码的艺术-Writing Code Like a Pianist

京东科技开发者

前端JS加密与Buspsuite的坦诚相待

权说安全

网络安全

XMind 2024思维导图:新增 310 张 AI 原创插画

Rose

XMind 2024思维导图 XMind 2024下载 XMind 2024中文 思维导图下载

荣耀时刻 | 第七在线荣获艾媒2023中国企业服务年度企业

第七在线

如何写好大模型提示词?来自大赛冠军的经验分享(进阶篇)

Baihai IDP

程序员 AI LLM 白海科技 Prompt Engineering

第七在线出席CFCG全国时尚消费品行业CIO年会荣获最佳供应商奖项

第七在线

ETLCloud:实现数据库快速输入输出的利器

RestCloud

数据同步 ETL

基础架构即代码 | 亚马逊如何在现实生活中实践 DevOps

亚马逊云科技 (Amazon Web Services)

DevOps 微服务 架构设计 Amazon Lambda Amazon API Gateway

BOE(京东方)携手新浪微博举办手机影像艺术展 创新科技赋能数字影像

科技热闻

容器技术-Docker_安装&操作

测试人

软件测试

QAnything本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答

汀丶人工智能

搜索推荐 LLM模型 智能问答 rag

Mozilla “Common Voice” 开源语音识别项目_Mozilla_CarolGuo_InfoQ精选文章