写点什么

Spark Summit EU 重头戏:TensorFlow、结构化的流和 GPU 硬件加速

  • 2016-11-22
  • 本文字数:843 字

    阅读完需:约 3 分钟

Spark Summit EU 2016 上星期在布鲁塞尔召开,其中大会中的重头戏是 Apache Spark 集成深度学习库 TensorFlow 、使用结构化的流进行在线学习和 GPU 硬件加速。

大会第一日最具特色的是预览了由 Spark 2.0 引入的一个创新。该 API 是针对 DataFrames 和 Datasets 简化了的接口,使其更容易去开发大数据应用。这个第二代的 Tungsten 引擎通过把 MPP 数据库的理念应用到数据处理查询使处理更接近于硬件了:针对中间数据和以节省空间的面向列方式保存在内存中的数据,生成的字节码充分利用 CPU 寄存器的能力。

不管 API 是否使用过,数据操作图都是通过 Catalyst Optimizer 优化过的,它针对所有集群上的计算指令生成执行计划,并针对每个操作进行优化。

结构化的流,这是作为阿尔法版针对流发布的一个新的高层API,在本次大会中也做了推介。该API 集成了Spark 的Dataset 和DataFrame,使开发人员可以以类似于Spark 批量API 的方式描述从(到)外部系统的数据读写。它通过以批处理指令的方式编译流处理指令提供了很强的一致性,并使事务型系统可以与存储系统集成在一起(比如HDFS 和AWS S3)。

在大会第二天,Databricks 的CEO Ali Ghodsi 将Spark 描绘成了将AI 大众化的一款工具,它简化了机器语言算法的数据准备和计算指令的管理。今年早些时候,深度学习类库TensorFlow 通过一个称为 TensorFrames 的类库集成运行于 Spark 之上。这个类库允许在 DataFrames 和 TensorFlow 之间在运行期传递数据。

数据科学专题召开了一个会议,主要围绕的主题是如何结构化流使机器学习具有弹性,并使其可以做到在线学习,这就有可能做到根据到达的数据去更新一些机器学习模型了,而不是采用一批离线任务去执行模型训练。

最后一个重头戏是在 Databricks 平台支持GPU 和更多深度学习类库集成的公告。GPU 的支持是通过像 CUDA 这样的硬件类库完成的,并可以在 Databricks 中预先构建它,据说这样集群设置成本就会有更低了。

查看英文原文: Spark Summit EU Highlights: TensorFlow, Structured Streaming and GPU Hardware Acceleration

2016-11-22 18:002082

评论

发布
暂无评论
发现更多内容

以资源为中心的计算机和现实分析

型火🔥

架构 分布式 操作系统 资源

算法之寻找二叉树结点的最近公共祖先

Skysper

算法

【Vue2.x 源码学习】第二十一篇 - 依赖收集的过程分析

Brave

源码 vue2 6月日更

HarmonyOS学习路之开发篇——Intent

爱吃土豆丝的打工人

HarmonyOS Ability intent 页面跳转

深入了解Spring之上下文

邱学喆

ApplicationContext LifecycleProccesor 事件传播者 ApplicationListener

数据库在各行各业的应用实践

xcbeyond

数据库 最佳实践 6月日更

打造一个通用、可配置、多句柄的数据上报 SDK

魅影

sqlite 数据库 APM 多线程 数据上报

App 上架包预检

魅影

ios Node 代码扫描 脚本 应用审核

JavaScript 学习(七)

空城机

JavaScript 大前端 6月日更

“云边+端”三管齐下,“有蓉”数据库助力四川气象进入天擎时代

脑极体

校友会小程序开发笔记十一: 后台管理系统功能设计与实现

CC同学

校友录小程序 同学录小程序

算法:八皇后问题

看山

面试 算法 6月日更

Gson的快速使用

卢卡多多

json Gson 6月日更

Windows11要来啦!!!

学神来啦

win10 win11

爱了,天猫“618”亿级高并发设计实战手册,限时分享

Java架构师迁哥

在线时间戳格式化转换工具【推荐】

入门小站

工具

浪潮云说丨构建实时监控能力,提升应用质效

云计算

react源码解析17.context

全栈潇晨

React

计算机性能测试

若尘

计算机组成原理 6月日更

浅析Angular数据状态管理框架:NgRx/Store

devpoint

angular.js angular store 6月日更

【21-14】singularity介绍

耳东@Erdong

6月日更 singularity

深入了解Spring之事件机制

邱学喆

观察者模式 spring的事件机制 EventListener注解

Linux之rm命令

入门小站

Linux

校友会小程序开发笔记十: 校友资讯功能模块设计与实现

CC同学

校友录小程序 同学录小程序

Python线性预测

Qien Z.

6月日更 线性预测

校友会小程序开发笔记九: 校友群助手功能模块设计与实现

CC同学

校友会小程序 同学录小程序

spring boot 自动装配原理详解

公众号:程序猿成神之路

Spring Boot

推荐算法团队介绍(十四)

Databri_AI

机器学习 算法 团队 推荐系统

☕【JVM技术探索】各种类型对象占用内存情况分析(下)

洛神灬殇

JVM 6月日更 对象大小 对象计算

Kubernetes手记(18)- 高级调度策略

雪雷

k8s 6月日更

你会写注释吗?

看山

Java 6月日更

Spark Summit EU重头戏:TensorFlow、结构化的流和GPU硬件加速_大数据_Alexandre Rodrigues_InfoQ精选文章