写点什么

IBM、Databricks 和 GraphLab 提出了用于建立预测应用程序的统一接口笔记本(Notebooks )

  • 2014-12-21
  • 本文字数:1079 字

    阅读完需:约 4 分钟

在巴塞罗那 StrataHadoop 会议最后一周,在 IBM 新兴互联网技术组织的副总裁罗德·史密斯介绍其正在开发的一款内部产品,它集成了数据源和数据分析以提供客户的咨询工作。使用基于网络IPython 风格的notebook 接口,用户可以搜索数据集,提取数据,并创建可实时嵌入到文档中的可视化。

史密斯说,商人们只有当他们看到时才知道他们想要什么,所以关键是要有一个平台,数据科学家可以在上面快速的开发、并对想法做出原型。这个工具到目前为止仅在内部使用,还有更多的一些技术观点,如它可以直接连接到Python 和Spark 上。最终数据的分析结果,可以很容易地通过REST 接口来对外提供,这样就可以生成例如基于JavaScript 的可视化效果。

notebook 是 IPython 中的一个特性,它提供类似于在 Web 浏览器上文本控制台界面的功能。以此为起点,它一直在扩展,集成了绘图功能,使它变成了一种独立于操作系统的提供图形输出的控制台。 Zeppelin(飞艇)是一个开源项目,它也包括了其他的语言,如 Scala 或 SQL。

这种方法成为会议期间的一个主题。来自 GraphLab 的肖恩·斯库利展示了他们新的数据分析产品 GraphLab Create ,它遵循了非常类似的方法。在现场演示中,斯库利将推荐器(recommender)放在网络笔记本(web notebook)中,然后从那里部署学会(机器学习)的模型。他们的目标是提供一个简单的工具,它允许数据科学家能够快速创建他们所谓的预测应用程序。斯库利表示,与在一种编程语言上开发系统原型,然后重新实现管道(Pipeline)来实现部署不同,通过这种工具你可以轻松地部署管道而无需更改工具集。

预测的 API 也是 PAPIs.io 会议上的焦点,这个会议在 StrataHadoop 会议的前两天举行。据组织会议的 Louis Dorard 说,弥补数据集分析和将分析结果转化为生产之间的差距实际上仍然是个很大的挑战,而他预计在这一领域未来将会有很多的创新潜力。

其中第一个预测应用程序是 Google’s prediction API ,首次发布于 2010 年。最近发布的类似产品有微软 Azure ML ,或 Databricks cloud 提供的基于网络统一接口的类似方法来实现快速原型和部署数据分析的解决方案。

当被问及这些不同的产品最终是否会被合并成统一的解决方案时,罗德·史密斯说,不同的受众仍然需要不同类型的解决方案。像 Databricks cloud,Azure ML,或 GraphLab 工具对数据科学家更适合,他们也可能精通编程,然而他们的工作更侧重于展示一个干净的界面来让数据科学家和商业人士可以更好地交流。总之,“笔记本(notebooks)将成为新的电子表格”。

查看英文原文: IBM, Databricks, GraphLab Present Notebooks as Unified Interfaces for Building Prediction Apps

2014-12-21 05:451457

评论

发布
暂无评论
发现更多内容

绘出「星辰大海」:华为云Astro轻应用新手指南Ⅱ

轶天下事

Sentieon软件应用之公共卫生机构

INSVAST

公共卫生 基因数据分析

面部表情识别技术的神经科学基础

来自四九城儿

Grafana可观测性grpc长链接处理

盈米基金

gRPC 可观测性 Grafana

Go语言协程池实现第二弹

FunTester

虚拟币商城数字货币交易分红模式系统开发[流程框架]

V\TG【ch3nguang】

数字货币交易平台开发 虚拟货币

PrecisionFDA:多组学样本错标校正挑战赛

INSVAST

数据分析 PrecisionFDA

面部表情识别的技术挑战与解决方案

来自四九城儿

大家都在用哪些测试用例管理平台?分析不同类型团队下的4类测试管理工具

爱吃小舅的鱼

产品经理 测试管理

从孤勇者到边缘云行业翘楚,网心科技做对了什么?

网心科技

C++类成员的访问权限以及类的封装

芯动大师

一文读懂 Nuxt.js 服务端组件

树上有只程序猿

React nuxt

华为云828企业节:助力精细化运营,提升开发效率

mecchi

小程序 云主机 云服务器 网站建设 云电脑

What's new in Pika v3.5.0

apache/dubbo-go

数据库 redis kv Redis 7 KV存储

茶桁的AI秘籍 - 人工智能数学基础篇 导言

茶桁

人工智能 数学 math

八月更新 | CI 构建计划触发机制升级、制品扫描 SBOM 分析功能上线!

CODING DevOps

微服务引擎 MSE 全新升级,15 分钟快速体验微服务全栈能力

阿里巴巴云原生

阿里云 微服务 云原生

绘出「星辰大海」:华为云Astro轻应用新手指南Ⅰ

轶天下事

如何构建 Sidecarless 模式的高性能服务网格

阿里巴巴云原生

阿里云 云原生 asm

08.25 北京站|阿里云 Serverless 技术实践营( AI 专场)开放报名

阿里巴巴云原生

阿里云 Serverless 云原生

学习Python文件备份和恢复技术,让您的数据永不丢失!

高端章鱼哥

Python Linux

Apache Dubbo 和 Apache RocketMQ 邀您参与,ASF 亚洲峰会 5 张门票免费送

阿里巴巴云原生

阿里云 云原生

虚拟币锁仓数字货币usdt投资理财系统开发合约代码

V\TG【ch3nguang】

虚拟货币 区块链技术开发

提升UMI分析精度和计算效率:Sentieon UMI分子标记处理模块

INSVAST

umi 基因数据分析 技术服务

富士胶片公司完成阿里云 PolarDB 数据库开源产品兼容适配

阿里云数据库开源

polarDB PolarDB for PostgreSQL 阿里云PolarDB

小灯塔系列-中小企业数字化转型系列研究——协同OA测评报告

向量智库

Programming abstractions in C阅读笔记:p127-p129

codists

2023-08-24:请用go语言编写。给定一个长度为n的数组arr, 现在你有一次机会, 将其中连续的K个数全修改成任意一个值, 请你计算如何修改可以使修改后的数 列的最长不下降子序列最长。 请输出

福大大架构师每日一题

福大大架构师每日一题

Sentieon发布RNAseq加速分析方案

INSVAST

数据分析 基因测序 RNAseq

Sentieon数据质控QC模块介绍

INSVAST

数据分析 QC 质控工具

面部表情识别技术在社交互动中的应用

来自四九城儿

IBM、Databricks和GraphLab提出了用于建立预测应用程序的统一接口笔记本(Notebooks )_REST_Mikio Braun_InfoQ精选文章