速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

谷歌开源 Quick Draw 数据集上线谷歌云,内含 5000 万涂鸦图像数据

  • 2018-11-19
  • 本文字数:1212 字

    阅读完需:约 4 分钟

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据


将 QuickDraw 数据汇总排列成字母形状(来源:Deborah Schmidt)


你可以通过涂鸦的方式了解一个人的很多东西。这是交互式网络实验Quick Draw背后的目的,它由 Google 创意实验室于 2016 年 11 月推出。Quick Draw 招募大胆的互联网用户来绘制草图,同时利用人工智能(AI)来尝试识别网友绘制的内容 ——有点像 Pictionary 的高科技版本。


Quick Draw 一共收集了超过 345 种类别的 10 亿张图画,谷歌在去年开源了其中 5000 万张图画,开源数据为完整的元数据,包括提示和用户地理位置。近日,谷歌将该开源数据集以 API 和 Polymer 组件的形式上线谷歌云平台。(给初学者的提示:Polymer 指的是一个用于构建 Web 应用程序的开源 JavaScript 库)


从本周开始,加入公共Google群组的任何谷歌云平台客户都可以通过搜索并添加到项目来把 Quick Draw API 添加到自己的库中。 使用 Polymer 组件,只需要使用一行代码就能在基于 Web 的应用程序中显示涂鸦。


谷歌创意实验室的创意技术专家 Nick Jonas 在接受电话采访时表示:“当我们一开始发布数据集时,它基本上是 345 个类别中每张图对应一个文件,并且使用起来有点麻烦。过去一年中进行的大量研究都是对整个数据集的大规模分析。 我们从开发人员那里得到了一些反馈,他们表示希望能有一种更简单的方法来对数据做快速建模。”



Jonas 解释说,通过 Quick Draw API(使用 Google Cloud Endpoints 来托管 Node.js API)可以直接访问原始数据集中包含的 5000 万个文件,但不需要把所有文件全部下载下来。 它为每一个涂鸦图案返回一个 JSON 对象或 HTML 画布渲染。


“通过这种方式,用户不需要下载一堆又一堆的数据就可以玩转这些图案了。”Jonas 表示。


从这些数据中总结出了一些令人惊讶的见解。Quartz 在 6 月份进行的一项研究发现,86%的美国玩家喜欢逆时针画圆圈,而 80%的日本玩家则喜欢顺时针画圆圈。(该研究发现的差异可归因于日语书写中一般采用从左上到右下的笔划顺序。)同时,Google Research 的一项内部调查发现,来自西方国家的用户涂鸦画出来的鱼的朝向与亚洲用户画出来鱼的方向相反。


Quick Draw 数据集也被创造性地用在了其他地方。 英国艺术家Neil Mendoza使用面部跟踪算法在人头上应用 Quick Draw 草图,德国计算机科学家Deborah Schmidt使用 30 万个随机涂鸦的子集来填充拼贴的字母模板。



Nelil Mendoza 将 Quick Draw 的脸部特征应用到真正的人脸上


未来,Quick Draw 的研究团队将考虑把这些涂鸦迁移到数据库中,以提供细粒度的访问控制。 理论上,到时候用户可以执行诸如“给我一张中国用户在 2017 年 3 月画的、能被认出来的图”这样的查询。


“我希望能够鼓励人们以新的方式使用数据集并做出贡献,看这个数据集最终可能扩展到多大,”Jonas 说, “我只是想鼓励更多开发者来玩转这个数据集。”




会议推荐:12 月 20-21,AICon 将于北京开幕,在这里可以学习来自 Google、微软、BAT、360、京东、美团等 40+AI 落地案例,与国内外一线技术大咖面对面交流。


2018-11-19 15:241244
用户头像
蔡芳芳 InfoQ主编

发布了 801 篇内容, 共 557.1 次阅读, 收获喜欢 2790 次。

关注

评论

发布
暂无评论
发现更多内容

为什么大家都在用WebRTC?

anyRTC开发者

音视频 WebRTC 语音通话 视频通讯

ROS CDK | 云上资源自动化部署新模式

郭旭东

阿里云 ROS 基础设施即代码 IaC

【Linux】使用 systemd 管理 frp 服务

赖猫

Linux 后端

腾讯安全姬生利:《数据安全法》下,云上数据安全最佳实践

腾讯安全云鼎实验室

数据安全 云安全 数据安全法

如何用视频云技术,搞一个爆红的 “反应视频” 项目?

阿里云CloudImagine

阿里云 RTC 英特尔 视频处理 视频制作

JavaScript 数组操作必须熟练运用的 10 个方法

devpoint

JavaScript array reduce 6月日更

墨奇,以“一手之力” 证明你就是你

E科讯

网络为本,博睿数据NPMD用20%的投入实现80%的功能

博睿数据

博睿数据 数据链DNA NPMD

剪视频一点都不难,多款超实用剪辑软件全方位评测!

懒得勤快

短视频 视频剪辑 视频制作

银行业运维指标体系建设实战

云智慧AIOps社区

智能运维

云开发是啥?看看它在编程导航项目的实践

程序员鱼皮

Java JavaScript 大前端 后端 云开发

前端 JavaScript 复制粘贴的奥义——Clipboard 对象概述

编程三昧

JavaScript 大前端

多云部署又添新「云」,EMQ X Cloud 正式支持腾讯云部署

EMQ映云科技

阿里云 IoT 华为云 云平台 #腾讯云

网络态势感知是什么?

郑州埃文科技

唯品会:在 Flink 容器化与平台化上的建设实践

Apache Flink

flink

机器数及特点

若尘

计算机组成原理 6月日更

5分钟速读之Rust权威指南(二十七)Rc<T>

wzx

rust

RestTemplate打印日志的正确姿势

编号94530

spring 日志 log RestTemplate

批量把Excel数据自动录入系统

木头

自动录入 批量录入 自动填表

Redis入门四:数据持久化

打工人!

redis redis持久化 6月日更

基于jira的需求交付效率统计

好孩子

Jira

北京多部门联合整治违规应用:过度收集用户信息该重罚

石头IT视角

网络攻防学习笔记 Day52

穿过生命散发芬芳

网络攻防 6月日更

工作年限、成长路线、进阶技术。怎样才能成为架构师?

Linux服务器开发

Linux服务器开发 Linux后台开发 软件架构师 服务器架构师 C++架构师

管理者如何避免主观偏见

石云升

职场经验 管理经验 6月日更

Flink 和 Iceberg 如何解决数据入湖面临的挑战

Apache Flink

flink

1小时学会不打代码制作一个网页精美简历(1)

1_bit

大前端 低代码 iVX 低代码开发平台

小红书 x StarRocks:实现数据服务平台统一化,简化数据链路,提升高并发极速查询能力

StarRocks

数据库 数据分析 广告系统 小红书 StarRocks

2021年,想要成为年薪百万的Java架构师需要掌握哪些技术?

Java架构师迁哥

58集团 x StarRocks:全面升级数据分析能力,满足多场景业务分析需求

StarRocks

数据库 数据分析 OLAP 58同城 StarRocks

☕【JVM技术探索】深入分析各种锁(锁膨胀)运作流程

洛神灬殇

JVM 锁升级 6月日更 锁分析

谷歌开源Quick Draw数据集上线谷歌云,内含5000万涂鸦图像数据_AI&大模型_KYLE WIGGERS_InfoQ精选文章