写点什么

Google 发布语音指令数据集

  • 2017-08-28
  • 本文字数:656 字

    阅读完需:约 2 分钟

深度学习在语音识别方面的使用方兴未艾,但是可用的训练数据集却不多见。虽然 Kaldi 这种软件可以使用神经网络进行训练,但是复杂的操作吓退了很多小白。Google 认识到,互联网上没有可供入门者快速入门深度学习的语言数据集,所以他们开源了语音指令数据集

TensorFlow AIY 团队开源的数据集包含 65000 个录音,每个录音时长几秒钟,包含 30 个左右的单词。它们是通过网站采集而来的,参与人数达到了数千人。团队贴心地附上了训练和预测的 TensorFlow 示例代码。数据集基于署名4.0 国际(CC By 4.0)许可发布,Google 表示将继续扩充这个数据集。Google 还指出,这个数据集特别适合新手入门。此外,他们也开源了收集录音的工具

对于想尝鲜的人,Google 制作了一个基于TensorFlow 的 Android 程序。程序会询问获取麦克风权限,随后会给出 10 个单词,程序将高亮显示已经被你读过的单词。

这个例子的效果和数据集有很大的关系,有可能不尽如人意,毕竟商业语言识别系统比这个复杂的多。Google 希望随着更多的数据加入,模型的识别效果会日趋完善。

使用 TensorFlow 进行语言识别的教程可以在这里找到。使用最新版本的TensorFlow 和主流配置,模型训练只需要几个小时。对神经网络进行微调可以解决不同的问题,例如不同的响应时间、大小,以及在不同平台上的准确度取舍问题。

查看英文原文: Launching the Speech Commands Dataset


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-28 19:002624

评论

发布
暂无评论
发现更多内容

《计算机程序的构造和解释(原书第2版)》PDF

程序员李木子

Total Video Converter Pro超级转霸 mac破解版 视频格式转换

Rose

reallusion卡通动画师最新下载 Cartoon Animator mac破解中文版

Rose

Nodejs - 9步开启JWT身份验证

南城FE

JavaScript 前端 nodejs JWT

Minitab Express数据分析适合什么人群?minitab express mac破解资源

Rose

【亿级数据专题】「分布式消息引擎」 盘点本年度我们探索服务的HA高可用解决方案

洛神灬殇

分布式 高可用 ha 优化技术 2024年第二十九篇文章

5G-A华彩开局,风流还看北京城

脑极体

通信

AI for Science,开启智能科学时代!

脑极体

AI

MacBooster 8 mac版:一站式系统清理维护工具

Rose

mac/win Animate 2021新功能 (An 2021中文直装版安装)

Rose

SwitchResX for Mac v4.13.3 正式版 自定义苹果电脑分辨率

Rose

幻兽帕鲁服务器搭建攻略:阿里云平台快速上手指南

全栈若城

Databend Stream 的设计与实现 | Data Infra 第 18 期

Databend

文心一言 VS 讯飞星火 VS chatgpt (192)-- 算法导论14.2 2题

福大大架构师每日一题

福大大架构师每日一题

FX影视特效3D动画渲染工具SideFX Houdini安装破解教程

Rose

Endurance for Mac 专业苹果mac电脑 电池续航提升工具

Rose

DJ必备:djay - DJ 应用&混音器 (djay pro Ai 激活版mac下载)

Rose

GreatSQL荣获2023 InfoQ“技术生态构建奖” 助力行业变革之路

GreatSQL

QT项目第一弹-自定义日志输出

springIce

日志 qt

灵伴科技(Rokid)借助 Knative 实现 AI 应用云原生 Serverless 化

阿里巴巴云原生

阿里云 云原生 云原生容器

PHP 增量代码规范 PHPCS 通过极狐 GitLab CI 平滑落地

极狐GitLab

Google发布语音指令数据集_Google_Beining_InfoQ精选文章