产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

Google 发布语音指令数据集

  • 2017-08-28
  • 本文字数:656 字

    阅读完需:约 2 分钟

深度学习在语音识别方面的使用方兴未艾,但是可用的训练数据集却不多见。虽然 Kaldi 这种软件可以使用神经网络进行训练,但是复杂的操作吓退了很多小白。Google 认识到,互联网上没有可供入门者快速入门深度学习的语言数据集,所以他们开源了语音指令数据集

TensorFlow AIY 团队开源的数据集包含 65000 个录音,每个录音时长几秒钟,包含 30 个左右的单词。它们是通过网站采集而来的,参与人数达到了数千人。团队贴心地附上了训练和预测的 TensorFlow 示例代码。数据集基于署名4.0 国际(CC By 4.0)许可发布,Google 表示将继续扩充这个数据集。Google 还指出,这个数据集特别适合新手入门。此外,他们也开源了收集录音的工具

对于想尝鲜的人,Google 制作了一个基于TensorFlow 的 Android 程序。程序会询问获取麦克风权限,随后会给出 10 个单词,程序将高亮显示已经被你读过的单词。

这个例子的效果和数据集有很大的关系,有可能不尽如人意,毕竟商业语言识别系统比这个复杂的多。Google 希望随着更多的数据加入,模型的识别效果会日趋完善。

使用 TensorFlow 进行语言识别的教程可以在这里找到。使用最新版本的TensorFlow 和主流配置,模型训练只需要几个小时。对神经网络进行微调可以解决不同的问题,例如不同的响应时间、大小,以及在不同平台上的准确度取舍问题。

查看英文原文: Launching the Speech Commands Dataset


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-08-28 19:002595

评论

发布
暂无评论
发现更多内容

EndNote 21 文献管理工具 Mac激活版 支持m1

加油,小妞!

文献管理 EndNote 21

数字城市运行监测主题指标设计思路探讨

Geek_37rwst

Mac模拟飞行驾驶游戏:X-Plane 12 for Mac

彩云

X-Plane 12 飞行模拟游戏

天翼云智算基础设施平台“云骁”,驱动智算产业创新发展

Geek_2d6073

服务器的操作系统有哪些?

Geek_f19a80

服务器

专业矢量图片转换工具 Vector Magic免激活最新

胖墩儿不胖y

Mac软件 矢量图软件

macos好玩的游戏:星际争霸母巢之战汉化激活版最新

mac大玩家j

mac游戏 星际争霸母巢之战破解版

sublime text for Mac 注册激活版 附 激活码 支持M1

加油,小妞!

代码编辑器 sublime text

SourceTree for Mac 最新激活 支持M1

彩云

sourcetree SourceTree Mac

Git客户端:SourceTree for Mac中文版

繁星

sourcetree Git客户端

2023-11-25:用go语言,给定一个数组arr,长度为n,表示n个格子的分数,并且这些格子首尾相连, 孩子不能选相邻的格子,不能回头选,不能选超过一圈, 但是孩子可以决定从任何位置开始选,也可以

福大大架构师每日一题

福大大架构师每日一题

感恩有你|恭喜 OpenTiny Vue 开源组件库喜迎1000+star!!!

OpenTiny社区

开源 前端 UI组件库

FFA 2023 「行业实践」专场: 金融/电力/汽车/互联网等多行业最佳实践

Apache Flink

flink

好用的图片处理工具 JixiPix Pastello Pro激活最新版

mac大玩家j

Mac软件 图像处理工具 图像编辑器

Macbook 电池最大充电限制工具:AlDente Pro for Mac

加油,小妞!

AlDente Pro

遥遥领先!TinyEngine 低代码引擎更新升级!

OpenTiny社区

开源 前端 低代码

Rectangle Pro for Mac 窗口布局增强工具

繁星

Rectangle Pro for Mac

开发看体育在线直播系统平台:多维内容和多元互动打造“有趣”观赛体验

软件开发-梦幻运营部

Kubernetes 漫游:etcd

Phoenix

FFA 2023 「流式湖仓」专场:从技术原理到应用实践打造流式湖仓新架构

Apache Flink

大数据 flink 实时计算

LED面板显示屏驱动芯片

梦笔生花

Linux系统下获取系统、BIOS、进程、网络等相关信息的方法和工具。

百度搜索:蓝易云

云计算 Linux 运维 云服务器 BIOS

【腾讯云云上实验室】用向量数据库——实现高效文本检索功能

熬夜磕代码、

数据库、

【k8s系列】搭建MicroK8s Dashboard教程。

百度搜索:蓝易云

云计算 Linux 运维 Web MicroK8s

Google发布语音指令数据集_Google_Beining_InfoQ精选文章