速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

Databricks 统一分析平台提供 AutoML Toolkit

  • 2019-10-26
  • 本文字数:783 字

    阅读完需:约 3 分钟

Databricks统一分析平台提供AutoML Toolkit

DatabricksApache Spark数据分析引擎的母公司)最近发布了统一数据分析平台,其中包括一个名为AutoML Toolkit的自动化机器学习工具。


通过自动化数据科学工作流的各个步骤——包括特征工程、超参数调优、模型搜索和部署——以获得完全受控和透明的增强 ML 体验。该工具包可用于帮助数据科学团队提高生产效率。这是Databricks实验室提供的面向公民和专家数据科学家的定制化解决方案。在MLflow中,AutoML 工具包的执行会被自动跟踪。


Databricks 实验室项目是一个实验性的端到端监督学习解决方案,用于自动化特征清理、特征向量化、模型选择和训练、超参数优化和选择、批量预测以及记录模型结果和训练运行等步骤。


统一分析平台主要包括以下三个组件:


  • Databricks 工作区:以统一数据科学和工程为目标,工作区利用共享交互式笔记本、工具和 API 处理所有分析过程(从 ETL 到模型训练和部署)。

  • Databricks 运行时:运行时组件帮助进行数据准备,并持续训练和部署 AI/ML 应用程序的模型。它支持Hyperopt、MLlib和MLflow之间的集成,从而支持分布式有条件的超参数调优、自动跟踪和增强的可视化。开始时,用户可以使用预配置的集群,包括一些流行的 ML 框架,如HadoopKafka、Spark、ParquetTensorFlowKerasScikit Learn

  • Databricks 云服务:云服务通过在云上提供完全托管的服务来帮助管理基础设施的复杂性。云服务包括微软Azure集成和 Amazon Web Services(AWS)。


Databricks 还提供与第三方机器学习工具的集成,如H2OSparkling WaterDataRobotXGBoost


要了解有关新的分析平台和 AutoML toolkit 的更多信息,请查看以下资源:



原文链接


Databricks’ Unified Analytics Platform Supports AutoML Toolkit


2019-10-26 08:002351

评论

发布
暂无评论
发现更多内容

李想解读《高效能人士的七个习惯》

我心依然

习惯 高效能人士的七个习惯 李想 汽车之家

孩子,我们在睡前一起来阅读 15 分钟的好书,让彼此都带着好的故事入眠。

叶小鍵

正确阅读 托马斯·奥本 Doug Antin 蒂·泰德罗克

Lean UX 教你设计如何驱动产品

Yanel 说敏捷产品

产品 敏捷 设计

工厂模式 (一)简单的工厂模式概念以及示例代码

LSJ

Flutter的staggered GridView详细使用

潘珉

flutter

面试官问你MyBatis SQL是如何执行的?把这篇文章甩给他

苹果看辽宁体育

mybatis

Elasticsearch 实战

代码诗人

有价值的产品=设计思维+精益创业+敏捷方法

老彦

Scrum 敏捷开发 Agile 设计思维 精益创业

ARTS - Week One

shepherd

js algorithm

实用贴丨正确的「递归」打开方式:让计算机像计算机一样去计算

博文视点Broadview

Python 递归

[Git] Git 可以这么学

猴哥一一 cium

git

2020年2月北京BGP机房网络质量评测报告

博睿数据

APM 机房 评测 世纪互联

内容比形式更重要

Winann

内容 生活 工作 形式主义

[GitHub] 跟我一起白嫖 GitHub Pages 做个人站点 ?

猴哥一一 cium

git GitHub GitHub Pages

「开放」对协作效率的影响

Tony Wu

产品 产品设计

基于mysqldump聊一聊MySQL的备份和恢复

麦洛

MySQL

给学妹的 Java 学习路线

武培轩

Java 学习 程序员 程序媛

五个“为什么” —— 读《精益创业》

YoungZY

读书笔记

Zabbix实战指南

橙子冰

技术 运维 监控 运维自动化 zabbix

学计算机你后悔了吗?

陈辰

学习 技术 大前端

数仓系列 | Flink 窗口的应用与实现

Apache Flink

大数据 flink 流计算 实时计算

软件开发生产率改进之我见(一)

清水

团队管理 软件工程 技术管理

Golang热更新原理

我心依然

nginx Linux 信号 Go 语言

2020年2月北京BGP机房网络质量评测报告

博睿数据

一文带你彻底厘清 Kubernetes 中的证书工作机制

首富手记

Kubernetes

python实现·十大排序算法之希尔排序(Shell Sort)

南风以南

Python 排序算法 希尔排序

有点干货 | Jdk1.8新特性实战篇(41个案例)

小傅哥

函数式接口 Lambda 小傅哥 jdk8 编码

翻译敏捷行业专业外文,不只是谷歌翻译

老彦

翻译 Scrum 敏捷开发 Agile

Kubectl exec 的工作原理解读

米开朗基杨

Kubernetes kubelet

关于问题的问题 —— 读《你的灯亮着吗?》

YoungZY

读书笔记 读书

游戏夜读 | 如何避免乏味?两则

game1night

Databricks统一分析平台提供AutoML Toolkit_大数据_Srini Penchikala_InfoQ精选文章