写点什么

谷歌 BigQuery 增加了新的公开数据集

  • 2017-01-09
  • 本文字数:624 字

    阅读完需:约 2 分钟

Stack Overflow近日宣布,通过谷歌 BigQuery 提供它的数据集。开发人员可以使用平常的 SQL 语句查询完整的 Stack Overflow 数据集,包括帖子、投票、标签和徽章。使用 BigQuery 的 REST API ,开发人员可以根据需要使用他们自选的工具导出数据。BigQuery 上的数据集支持联合查询,开发人员使用普通的 SQL 就可以跨领域获得有用的见解。

除了 Stack Overflow 的数据集以外,BigQuery 还支持对 Hacker News 数据集 GitHub 数据集的访问,这两个数据集连同 Stack Overflow 数据集可以提供有用的见解。BigQuery 近日还围绕纽约市的数据增加了三个数据集,分别是关于机动车碰撞城市自行车旅行及311 非紧急市政服务电话请求。BigQuery 之前已经有一个数据集,其中包含2009 年到2015 年纽约市的每一次出租车和豪华轿车旅行,上述三个数据集对此是一个补充。

当前,BigQuery 还有其他可用的数据集,其中包括气象信息部分数据远至1763 年)、医疗数据、350 万数字化图书、一个包含元数据并标注了900 万URL 的图像数据集、美国国税局及美国职棒大联盟的数据。还有一个数据集包含了世界各地的新闻和事件,每15 分钟更新一次。该数据集是由 GDELT 项目提供的。此外,BigQuery 还包含 Personal Genome 项目提供的 Genomics 数据集 Wikipedia 页面访问量数据以及将近 20 亿条 Reddit 评论

感兴趣的读者可以通过 BigQuery 控制台获取 Stack Overflow 数据集,也可以通过 reddit 社区参与进一步的讨论。

查看英文原文 Google BigQuery Adds New Public Datasets

2017-01-09 18:002568
用户头像

发布了 1008 篇内容, 共 390.1 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

为什么我的 C4C Service Request 没办法 Release 到 ERP?

汪子熙

Cloud SAP abap C4C 11月日更

云原生训练营作业--部署k8s集群

好吃不贵

Redis高可用的绝对的利器——持久化(RDB和AOF)

李子捌

redis redis持久化 签约计划第二季

Linux 调优之:调整 bond hash 策略提升网络吞吐能力

卫智雄

限流系列文章——漏斗限流

李子捌

redis 限流 签约计划第二季

新成就!OceanBase 入选 Forrester 首份分布式数据库报告

OceanBase 数据库

数据库 开源 新闻 oceanbase 荣誉

限流系列文章——令牌桶限流

李子捌

redis 限流 签约计划第二季

URL URI傻傻分不清楚,dart告诉你该怎么用

程序那些事

flutter dart 程序那些事 11月日更

签到功能怎么做?Bitmaps助你一臂之力

李子捌

redis bitmaps 签约计划第二季

[Pulsar] 消息从Producer到Broker的历程

Zike Yang

Apache Pulsar 11月日更

音视频理论(1)- 音频格式之 Monkeys Audio(APE)

liuzhen007

签约计划第二季

在线文本交集计算工具

入门小站

工具

SAP Cloud for Customer Price 计价简介

汪子熙

Cloud SAP C4C 11月日更 pricing

数据分析从零开始实战,Pandas读写Excel/XML数据

老表

Python 数据分析 Excel pandas 11月日更

k8s statefulset controller源码分析

良凯尔

源码 Kubernetes 源码分析 #Kubernetes#

JSON 数据格式

大数据技术指南

11月日更

Skip List(跳跃列表)它到底好在哪?今天我们不仅只聊为什么,还手写一个玩玩

李子捌

redis skiplist 签约计划第二季

HyperLogLog这里面水很深,但是你必须趟一趟

李子捌

redis 签约计划第二季

数据库不能没有事务,今天他来了——Redis事务详述

李子捌

redis 事务 签约计划第二季

听说你的服务经常被打崩?试试布隆过滤器(Bloom Filter)

李子捌

redis 布隆过滤器 签约计划第二季

【高并发】如何使用Java7提供的Fork/Join框架实现高并发程序?

冰河

Java 并发编程 多线程 高并发 异步编程

Prometheus Exporter (十三)Elasticsearch Exporter

耳东@Erdong

elasticsearch Prometheus exporter 11月日更

李子捌 Redis精通系列文章 研究分享| 内容合集

李子捌

redis 内容合集 签约计划第二季 技术专题合集

Redis之Geospatial,助你轻松实现附近的xx功能

李子捌

redis geospatial 签约计划第二季

限流系列文章——滑动窗口限流

李子捌

redis 限流 签约计划第二季

CSS之盒模型

Augus

CSS 11月日更

跟小师妹一起学JVM-系列文章

程序那些事

Java JVM JIT 内容合集 签约计划第二季

2021年大数据开发发展趋势

五分钟学大数据

11月日更

转型中的学习型组织 ——阅读《第五项修炼》有感

研发管理Jojo

系统性思考 企业转型

Flutter 中的手势【Flutter 专题10】

坚果

flutter 签约计划第二季

都在用MQ,Redis的Pub/Sub也可以试着了解下

李子捌

redis MQ 签约计划第二季

谷歌BigQuery增加了新的公开数据集_Google_Alex Giamas_InfoQ精选文章