免费下载案例集|20+数字化领先企业人才培养实践经验 了解详情
写点什么

IBM、Databricks 和 GraphLab 提出了用于建立预测应用程序的统一接口笔记本(Notebooks )

  • 2014-12-21
  • 本文字数:1079 字

    阅读完需:约 4 分钟

在巴塞罗那 StrataHadoop 会议最后一周,在 IBM 新兴互联网技术组织的副总裁罗德·史密斯介绍其正在开发的一款内部产品,它集成了数据源和数据分析以提供客户的咨询工作。使用基于网络IPython 风格的notebook 接口,用户可以搜索数据集,提取数据,并创建可实时嵌入到文档中的可视化。

史密斯说,商人们只有当他们看到时才知道他们想要什么,所以关键是要有一个平台,数据科学家可以在上面快速的开发、并对想法做出原型。这个工具到目前为止仅在内部使用,还有更多的一些技术观点,如它可以直接连接到Python 和Spark 上。最终数据的分析结果,可以很容易地通过REST 接口来对外提供,这样就可以生成例如基于JavaScript 的可视化效果。

notebook 是 IPython 中的一个特性,它提供类似于在 Web 浏览器上文本控制台界面的功能。以此为起点,它一直在扩展,集成了绘图功能,使它变成了一种独立于操作系统的提供图形输出的控制台。 Zeppelin(飞艇)是一个开源项目,它也包括了其他的语言,如 Scala 或 SQL。

这种方法成为会议期间的一个主题。来自 GraphLab 的肖恩·斯库利展示了他们新的数据分析产品 GraphLab Create ,它遵循了非常类似的方法。在现场演示中,斯库利将推荐器(recommender)放在网络笔记本(web notebook)中,然后从那里部署学会(机器学习)的模型。他们的目标是提供一个简单的工具,它允许数据科学家能够快速创建他们所谓的预测应用程序。斯库利表示,与在一种编程语言上开发系统原型,然后重新实现管道(Pipeline)来实现部署不同,通过这种工具你可以轻松地部署管道而无需更改工具集。

预测的 API 也是 PAPIs.io 会议上的焦点,这个会议在 StrataHadoop 会议的前两天举行。据组织会议的 Louis Dorard 说,弥补数据集分析和将分析结果转化为生产之间的差距实际上仍然是个很大的挑战,而他预计在这一领域未来将会有很多的创新潜力。

其中第一个预测应用程序是 Google’s prediction API ,首次发布于 2010 年。最近发布的类似产品有微软 Azure ML ,或 Databricks cloud 提供的基于网络统一接口的类似方法来实现快速原型和部署数据分析的解决方案。

当被问及这些不同的产品最终是否会被合并成统一的解决方案时,罗德·史密斯说,不同的受众仍然需要不同类型的解决方案。像 Databricks cloud,Azure ML,或 GraphLab 工具对数据科学家更适合,他们也可能精通编程,然而他们的工作更侧重于展示一个干净的界面来让数据科学家和商业人士可以更好地交流。总之,“笔记本(notebooks)将成为新的电子表格”。

查看英文原文: IBM, Databricks, GraphLab Present Notebooks as Unified Interfaces for Building Prediction Apps

2014-12-21 05:451434

评论

发布
暂无评论
发现更多内容

Cordova应用的JavaScript代码和自定义插件代码的调试

汪子熙

JavaScript android 28天写作 12月日更 cordova

Python爬虫反爬,你应该从这篇博客开启,UA反爬,Cookie 特定参数反爬

梦想橡皮擦

12月日更

DDD领域驱动设计实战(四)-值对象

JavaEdge

12月日更

2021学习总结

将军-技术演讲力教练

React进阶(九):React-Redux

No Silver Bullet

React React-Redux 12月日更

Kubernetes + Spring Cloud 集成链路追踪 SkyWalking

zuozewei

链路追踪 性能测试 性能监控 12月日更

☕【Java深层系列】「技术盲区」让我们一起去挑战一下如何读取一个较大或者超大的文件数据!

洛神灬殇

Mmap 12月日更 MappedByteBuffer FileChannel

天下武功,无坚不摧,唯快不破

Tiger

28天写作

🏆【Alibaba中间件技术系列】「EasyExcel实战案例」实战研究一下EasyExcel如何从指定文件位置进行读取数据

洛神灬殇

EasyExcel Apache POI Alibaba 12月日更

Prometheus Exporter (三十一)ProxySQL Exporter

耳东@Erdong

Prometheus 28天写作 exporter 12月日更 ProxySQL

微信朋友圈高性能分析

swallowluo

架构训练营 架构实战营 「架构实战营」

Guava的布隆过滤器

程序员历小冰

算法 布隆过滤器 28天写作 12月日更

模块二课程作业

李晓笛

架构实战营

信贷风控从Model-centric到Data-centric

一直学习一直爽

互联网金融 风控模型 机器学习算法

[Pulsar] 设置认证和鉴权

Zike Yang

Apache Pulsar 12月日更

LabVIEW图像特征与机器视觉概念(理论篇—4)

不脱发的程序猿

机器视觉 图像处理 工业自动化 图像特征

微信朋友圈高性能架构分析与设计

皓月

架构实战 #架构实战营 「架构实战营」

kubernetes APIServer是如何限流的?

xcbeyond

Kubernetes 限流 28天写作 12月日更

情绪价值

搬砖的周狮傅

情绪

前端开发:关于Vue组件中的data属性值是函数而不是对象的详解

三掌柜

28t 28天写作 12月日更

关于HDFS中的Lease Recovery

Joseph295

架构实战营 第 4 期 模块二作业

架构实战营 模块二 「架构实战营」

Android ShareSDK 微博分享 (8995)app auth fail for appKey&sign&package 解决

阿策小和尚

28天写作 Android 小菜鸟 12月日更

模块七作业——王者荣耀商城异地多活架构设计

deng

架构实战营

JVM学习笔记

Changing Lin

12月日更

dart系列之:这里不需要标新立异,dart代码最佳实践

程序那些事

flutter dart 代码规范 程序那些事 12月日更

模块二:朋友圈

撿破爛ぃ

「架构实战营」

架构训练营 - 模块二作业

伊静西蒙

JavaScript 数组方法 .map() 的 5 个使用场景

devpoint

JavaScript map array 12月日更

从对象内存布局了解锁的膨胀

Ayue、

锁升级

跟着动画学Go数据结构之希尔排序

宇宙之一粟

golang 希尔排序 12月日更

IBM、Databricks和GraphLab提出了用于建立预测应用程序的统一接口笔记本(Notebooks )_REST_Mikio Braun_InfoQ精选文章