微软最新发布了 Cosmos DB 对 Jupyter Notebook 支持的一般可用版(GA),为直接对所有数据模型运行查询提供了集成的支持。鉴于可在 Cosmos DB 中直接运行所有 Notebook,这样无需抽取数据,即可直接在 Azure 门户分析和可视化数据。
Cosmos DB是微软的全球分布式 NoSQL 数据库服务,支持绝大多数数据模型,提供操作 SQL 和数据库表等的 API,同时也支持 Cassandra、Gremlin 和 Spark。和 Amazon 的DynamoDB和 Google 的Cloud Datastore一样,Cosmos DB 也提供低延迟服务和多种一致性模型。相应地,支持对所有模型使用 Jupyter Notebook,意味着 Notebook 可以在任何模型上查询数据。使用这些 Notebook 可支持多种操作,例如运行交互查询、探索和分析数据,进而支持数据的可视化。此外,通过 Notebook 可构建、训练和运行机器学习模型,为支持人工智能提供了可能。
所有上述特性均借助于Jupyter的原生 Python 内核,但也可以借助于所谓的“魔术命令”(magic command)。魔术命令支持运行 SQL API 查询。这两者可进一步结合使用,发挥各自的查询和渲染能力。由此,Notebook 支持实现大量应用场景,如官方文档所列:
数据可视化:Jupyter Notebook支持用户以共享Notebook的形式可视化数据,该共享Notebook以图形的方式呈现特定数据集。Jupyter Notebook支持用户创作可视化文件并共享,支持对共享代码和数据集做交互式变更。
代码共享:虽然GitHub等服务提供了共享代码的方法,但是此类服务基本上是非交互式的。用户可使用Jupyter Notebook直接在Azure门户中查看、执行代码,并显示结果。
与代码的实时交互:Jupyter Notebook中,代码是动态的;可以迭代递增地进行实时编辑和重新运行。Notebook还可嵌入一些用户控件,例如滑块或文本输入字段。这些控件可作为代码、演示或概念验证(PoC)的输入源。
对代码示例和数据探索结果形成文档:如果你想要逐行说明一段代码在支持实时输出的Azure Cosmos DB中的工作方式,那么可将代码嵌入在Jupyter Notebook中。代码将保持其全部功能。同时,你可以连同文档一起添加交互性。
Cosmos魔术命令:在Jupyter Notebook中,用户可使用Azure Cosmos DB自定义的魔术命令简化交互式计算。例如,魔术命令“%%sql”支持用户直接在Notebook中使用SQL API查询Cosmos容器。
一站式环境:Jupyter Notebook将代码、富文本、图像、视频、动画、数学方程、绘图、地图、交互式图形、Widget和图形用户界面组合在同一文档中。
针对操作数据,Cosmos DB Notebook 提供了多种内建的软件包,并支持安装额外的软件包。该 GA 版随Azure Cosmos DB Python SDK for SQL API第 4 版一并发布,用户可从任一 Notebook 直接调用。需强调的是,Cosmos DB 对 Jupytor 的支持当前仅限于 Australia East、East US、East US 2、North Europe、South Central US、Southeast Asia、UK South、West Europe 和 West US 2 等 Azure 区域。
原文链接:
Microsoft Announces General Availability of Jupyter Notebooks Support for Cosmos DB
评论