BigQuery 是 Google 推出的一款 SaaS 查询产品,其发展势头似乎越来越好。它允许查询云中的大型柱状数据结构。开发人员可以通过上传到 Google 云存储(相当于 Amazon 的 S3)或者以流数据的方式把数据加载到 BigQuery 中,然后使用类似 SQL 的查询语言执行 OLAP 风格的查询。
现在,越来越多的从业者分享了他们的 BigQuery 实践经验。例如,Shine Technologies 的 Graham Polley 在报告中写道:
我们决定自己进行测试,使用一个 15 亿行的数据集向 BQ 发起挑战。事情即将变得非常有趣——BigQuery 真能像 Google 的宣传口号所说的那样“能够对数十亿行的大规模数据集进行交互式分析”吗?印象深刻,它能。确切地说,印象非常深刻。即使不使用缓存结果(缓存结果可以开启和关闭),使用相对复杂的查询在一个 15 亿行的大规模数据集中汇总数据,在 20 到 25 秒的时间里,我们就能获得一致的结果。
BigQuery 可以单独使用,也提供与其它服务的集成,如 Google Apps 脚本或 Google 分析。关于后者,Jonathan Weber(来自 LunaMetrics 的数据传教士)写过一篇内容丰富的文章,其中他写道:
首先,BigQuery 导出功能只对 Google 分析付费版客户可用。他们可以通过付费版账户管理器启用 BigQuery 导出功能。请注意,在 BigQuery 中,数据存储和处理都是收费的,但 Google 分析付费版用户可以使用每月 500 美元的信用额度来支付那些费用。在许多情况下,那 500 美元都会发挥很大作用。作为参考,我看了我们其中一位使用 BigQuery 的付费版客户。他们的网站每月大约有 600 万的访问量和 5000 万的综合浏览量。数据从九月份开始导出,本月他们的数据存储费用大约为 12.86 美元。
虽然 BigQuery 只是一个基于云的解决方案,但支撑 BigQuery( Dremel )的底层技术是许多像 Apache Drill 或 Impala 那样的开源SQL-in-Hadoop 解决方案的核心。
查看英文原文:**** Google’s BigQuery Gaining Momentum
评论