在最近的 Google Cloud Platform Next 巴黎体验活动中,谷歌宣布了一个数据可视化服务的测试版本,名为 Cloud Dtalab 。Cloud Datalab 允许开发人员通过一种交互式 Web 浏览器体验研究和分析数据。
Greg DeMichellie 是谷歌的产品管理总监。他将这项服务描述为“一种工具,该工具允许用户分析原始数据,并以一种快速、简单、高效的方式研究、分享和发布报告。”
DeMichellie列举了 Cloud Datalab 的核心功能:
- 在谷歌云平台上研究、转换、可视化和处理数据。它可以管理兆字节和千兆字节的数据。
- 可以与多种语言代码完美结合:Python、SQL 及 JavaScript( BigQuery UDF )。
- 构建和测试 Google BigQuery 部署的数据管道。
- 创建、优化及部署机器学习模型。
由于 Cloud Datalab 是一项托管服务,所以开发人员和数据科学家可以预期,Cloud Datalab 会通过配置和基于向导的设置过程提供一个很低的使用门槛。要使用 Cloud Datalab,开发人员必须将该服务部署为 Google App Engine 应用程序。这样一来,Datalab 将同时使用 Google Big Query 和 Cloud Storage 作为后台服务。
Cloud Datalab 还使用了 Jupyter ,开发人员可以将脚本、文档、可视化表示和结果存储在 notebook 中。开发人员可以使用现有的 Jupyter 包,包括统计和机器学习库。Datalab 服务的用户还可以同类似 GitHub 和 Bitbucket 这样的非谷歌源码控制库共享 notebook。
下图展示了一个可供新用户使用的预置 notebook 和服务中已有的 GitHub 集成:
在价格方面,谷歌表示,用户只需要支付包括BigQuery 和Cloud Storage 在内的App Engine 所消耗的云资源的费用。谷歌还在GitHub 上开源了Cloud Datalab 项目,允许开发人员派生或提交pull request。
在云数据研究和可视化领域,谷歌面临着亚马逊、微软这些熟悉的竞争对手的竞争。亚马逊的 QuickSight 就是一个低门槛的、基于配置的商业智能工具,客户通过浏览器只需要很短的时间就可以开始可视化他们的数据。亚马逊还采用了一种同谷歌类似的模型,将其可视化平台置于其他自有服务之上,如亚马逊 RDS 和亚马逊 DynamoDB 。微软的 PowerBi 也是一款有名的 BI 工具,允许终端用户和开发人员使用来自各种本地和云服务的数据,并在 Web 浏览器或移动设备上将其可视化。微软还使用了许多类似 Excel 的、用户熟悉的特性,非常有利于该工具的推广。
评论