写点什么

Google 发布语音指令数据集

  • 2017-08-28
  • 本文字数:656 字

    阅读完需:约 2 分钟

深度学习在语音识别方面的使用方兴未艾,但是可用的训练数据集却不多见。虽然 Kaldi 这种软件可以使用神经网络进行训练,但是复杂的操作吓退了很多小白。Google 认识到,互联网上没有可供入门者快速入门深度学习的语言数据集,所以他们开源了语音指令数据集

TensorFlow AIY 团队开源的数据集包含 65000 个录音,每个录音时长几秒钟,包含 30 个左右的单词。它们是通过网站采集而来的,参与人数达到了数千人。团队贴心地附上了训练和预测的 TensorFlow 示例代码。数据集基于署名4.0 国际(CC By 4.0)许可发布,Google 表示将继续扩充这个数据集。Google 还指出,这个数据集特别适合新手入门。此外,他们也开源了收集录音的工具

对于想尝鲜的人,Google 制作了一个基于TensorFlow 的 Android 程序。程序会询问获取麦克风权限,随后会给出 10 个单词,程序将高亮显示已经被你读过的单词。

这个例子的效果和数据集有很大的关系,有可能不尽如人意,毕竟商业语言识别系统比这个复杂的多。Google 希望随着更多的数据加入,模型的识别效果会日趋完善。

使用 TensorFlow 进行语言识别的教程可以在这里找到。使用最新版本的TensorFlow 和主流配置,模型训练只需要几个小时。对神经网络进行微调可以解决不同的问题,例如不同的响应时间、大小,以及在不同平台上的准确度取舍问题。

查看英文原文: Launching the Speech Commands Dataset


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-28 19:002576

评论

发布
暂无评论
发现更多内容

牛牛牛!一张图,5个章节就把高并发/高可用讲清楚了!

Java架构师迁哥

数字人民币专利数量井喷 智能合约成新方向

CECBC

如何激发责任心

escray

学习 极客时间 朱赟的技术管理课 7月日更

Windows Service 小品

喵叔

7月日更

Linux之top命令

入门小站

Linux

在线常用crontab表达式大全验证解析

入门小站

工具

星环研发总监为你揭秘TDH8.0的前因后果 | TDH8.0 使用必读

星环科技

ES6中的生成器函数是什么?

devpoint

ES6 JavaScrip 7月日更

今晚拿下PHP反序列化的一系列操作

网络安全学海

php 网络安全 信息安全 渗透测试 漏洞分析

音视频延时和抖动问题分析和解决

hanaper

对于大部分Java开发者说“60W年薪是无法逾越沟壑”你赞同吗?

愚者

Java 后端

再见~ 蚂蚁金服!(已拿offer)

java小李

JavaScript java新语法

音视频面试题

hanaper

语音 图像识别 图像处理 视频流 图像增强

百分点数据科学实验室:智慧应急安全生产智能决策方案建设实践

百分点认知智能实验室

结语:Apache Spark 3_0(十二)

Databri_AI

sql spark API

安装 Druid 安装的时候提示 JAVA 版本的问题

HoneyMoose

卧槽这菜鸡程序员不讲武德,年薪居然有50万(50万面经分享)

java小李

面试

详细了解Spring Bean 生命周期

愚者

Java Spring Bean

鉴释宣布加入RISC-V基金会、Linux基金会、seL4基金会与IoXt联盟, 旨在实现静态代码分析服务的全方位赋能

鉴释

Linux IoT 静态代码分析

一文搞定,轻松掌握,进程的内存消耗和泄漏

奔着腾讯去

内存泄露 Linux Kenel 进程管理 内存消耗 VMA

网络攻防学习笔记 Day89

穿过生命散发芬芳

网络攻防 7月日更

Java程序员掌握这份文档,让你刚出来三个月从6K涨到15K

愚者

Java 涨薪

被下架三次了,手慢无,23w字中高级Java面试题库!

Java架构师迁哥

如何对抗信息茧房?

caiyongji

程序员 信息茧房

腾讯被罚了!!!

Jackpop

全是蓝光,太狠了!

Jackpop

讲的是切片,但好像又不只是切片?

Gopher指北

Go 语言

数字人民币是现有世界上最完整设计最灵活的央行数字货币

CECBC

Java基础之hashcode剖析

愚者

Java

关于机器学习的“灵魂拷问” ,这样的答案硬核!| 云途专栏

亚马逊云科技 (Amazon Web Services)

硬核!一套基于SpringBoot + Vue 的开源物联网智能家居系统!

编程菌

Java 编程 程序员 项目 计算机

Google发布语音指令数据集_Google_Beining_InfoQ精选文章