QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

Google 发布语音指令数据集

  • 2017-08-28
  • 本文字数:656 字

    阅读完需:约 2 分钟

深度学习在语音识别方面的使用方兴未艾,但是可用的训练数据集却不多见。虽然 Kaldi 这种软件可以使用神经网络进行训练,但是复杂的操作吓退了很多小白。Google 认识到,互联网上没有可供入门者快速入门深度学习的语言数据集,所以他们开源了语音指令数据集

TensorFlow AIY 团队开源的数据集包含 65000 个录音,每个录音时长几秒钟,包含 30 个左右的单词。它们是通过网站采集而来的,参与人数达到了数千人。团队贴心地附上了训练和预测的 TensorFlow 示例代码。数据集基于署名4.0 国际(CC By 4.0)许可发布,Google 表示将继续扩充这个数据集。Google 还指出,这个数据集特别适合新手入门。此外,他们也开源了收集录音的工具

对于想尝鲜的人,Google 制作了一个基于TensorFlow 的 Android 程序。程序会询问获取麦克风权限,随后会给出 10 个单词,程序将高亮显示已经被你读过的单词。

这个例子的效果和数据集有很大的关系,有可能不尽如人意,毕竟商业语言识别系统比这个复杂的多。Google 希望随着更多的数据加入,模型的识别效果会日趋完善。

使用 TensorFlow 进行语言识别的教程可以在这里找到。使用最新版本的TensorFlow 和主流配置,模型训练只需要几个小时。对神经网络进行微调可以解决不同的问题,例如不同的响应时间、大小,以及在不同平台上的准确度取舍问题。

查看英文原文: Launching the Speech Commands Dataset


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-28 19:002684

评论

发布
暂无评论
发现更多内容

好好编程-物流项目01【搭建maven工程】

Java 程序员 后端

【Promise 源码学习】第四篇 - 翻译并理解 Promise A+ 规范

Brave

源码 Promise 11月日更

如何用RabbitMQ实现延迟队列

Java 程序员 后端

如何给网关设计一款专属的权限控制「责任链设计模式」(1)

Java 程序员 后端

字节面试官:你觉得HTTPS能防止重放攻击吗?

Java 程序员 后端

040022-week3-design

InfoQ_70156470130f

字节后端开发3+4面,终于拿到秋招第一个offer

Java 程序员 后端

字节跳动武汉招聘2000人,这套JAVA面试题被刷爆了

Java 程序员 后端

Prometheus HTTP API 查询(五)告警接口

耳东@Erdong

Prometheus PromQL HTTP API 11月日更

好好编程-物流项目07【SpringMVC整合】

Java 程序员 后端

字节后端开发3+4面,终于拿到秋招第一个offer(1)

Java 程序员 后端

好好编程-物流项目04【Mybatis逆向工程】

Java 程序员 后端

如何封装原生的-Java-NIO-以及扩展?详细到让你分分钟搞定Netty

Java 程序员 后端

学生管理系统架构设计文档

唐敏

「架构实战营」

字节跳动Java面试题精选——算法与数据结构「跳槽面试必备」

Java 程序员 后端

学会IDEA REST Client后就可以丢掉postman了

Java 程序员 后端

好险!一入职就遇到MySQL这么大Bug!差点背锅走人!

Java 程序员 后端

如何给网关设计一款专属的权限控制「责任链设计模式」

Java 程序员 后端

如何设计一个高可用系统?简单总结了10来种方法,今天全部告诉你们!

Java 程序员 后端

好好编程-物流项目13【登录认证-shiro实现】

Java 程序员 后端

如何让Kafka在保证高性能、高吞吐的同时通过各种机制来保证高可用性?

Java 程序员 后端

学会5位大牛撰写756页大规模Linux集群架构实践PDF,成功入职华为

Java 程序员 后端

安卓程序员必备hook技术之进阶篇

Java 程序员 后端

女生适合学编程吗?

Java 程序员 后端

进击的Java(三)

ES_her0

11月日更

JavaScript 中对象处理之Object.freeze 与 Object.seal

devpoint

JavaScript Object 11月日更

通过程序来介绍Node.js 的几个文件读写和事件监听API

Regan Yue

nodejs js Node 11月日更

如何在本地部署多个Tomcat服务

Java 程序员 后端

解决:http: TLS handshake error from *

liuzhen007

11月日更

如何设计一个高性能Elasticsearch mapping

Java 程序员 后端

如何调优 Java 垃圾收集

Java 程序员 后端

Google发布语音指令数据集_Google_Beining_InfoQ精选文章