写点什么

Databricks 统一分析平台提供 AutoML Toolkit

  • 2019-10-26
  • 本文字数:783 字

    阅读完需:约 3 分钟

Databricks统一分析平台提供AutoML Toolkit

DatabricksApache Spark数据分析引擎的母公司)最近发布了统一数据分析平台,其中包括一个名为AutoML Toolkit的自动化机器学习工具。


通过自动化数据科学工作流的各个步骤——包括特征工程、超参数调优、模型搜索和部署——以获得完全受控和透明的增强 ML 体验。该工具包可用于帮助数据科学团队提高生产效率。这是Databricks实验室提供的面向公民和专家数据科学家的定制化解决方案。在MLflow中,AutoML 工具包的执行会被自动跟踪。


Databricks 实验室项目是一个实验性的端到端监督学习解决方案,用于自动化特征清理、特征向量化、模型选择和训练、超参数优化和选择、批量预测以及记录模型结果和训练运行等步骤。


统一分析平台主要包括以下三个组件:


  • Databricks 工作区:以统一数据科学和工程为目标,工作区利用共享交互式笔记本、工具和 API 处理所有分析过程(从 ETL 到模型训练和部署)。

  • Databricks 运行时:运行时组件帮助进行数据准备,并持续训练和部署 AI/ML 应用程序的模型。它支持Hyperopt、MLlib和MLflow之间的集成,从而支持分布式有条件的超参数调优、自动跟踪和增强的可视化。开始时,用户可以使用预配置的集群,包括一些流行的 ML 框架,如HadoopKafka、Spark、ParquetTensorFlowKerasScikit Learn

  • Databricks 云服务:云服务通过在云上提供完全托管的服务来帮助管理基础设施的复杂性。云服务包括微软Azure集成和 Amazon Web Services(AWS)。


Databricks 还提供与第三方机器学习工具的集成,如H2OSparkling WaterDataRobotXGBoost


要了解有关新的分析平台和 AutoML toolkit 的更多信息,请查看以下资源:



原文链接


Databricks’ Unified Analytics Platform Supports AutoML Toolkit


2019-10-26 08:002367

评论

发布
暂无评论
发现更多内容

Java渣渣外包开发3年,4面终揽下美团面试官,含泪拿到22koffer

比伯

Java 编程 程序员 架构 面试

算法太TM重要了!实战讲述Flutter跨平台框架应用,3面直接拿到offer

欢喜学安卓

android 程序员 面试 移动开发

一个典型的大型互联网应用系统使用了哪些技术方案和手段,主要解决什么问题?

我们新四军不拿群众一针一线

懒人神器——新手必备的图片后期处理软件

懒得勤快

图片后期 修图 滤镜 ps

Netty RPC Demo 实现

Java RPC Demo

流动性挖矿DAPP软件系统开发

系统开发

世界之书:《人类简史》与想象中的共同体

lidaobing

28天写作

elasticsearch打怪升级之基础篇

泽睿

ES

生产环境全链路压测建设历程13:淘宝网稳定性近十年发展历程 2009年-2019年

数列科技杨德华

全链路压测 七日更

Week 13

黄立

Eureka 架构原理及其源码分析

飞鸟

Spring Cloud Eureka

太赞了!2021疫情期间八家大厂的Android面试经历和真题整理,值得收藏!

欢喜学安卓

android 程序员 面试 移动开发

阿里技术分享:电商IM消息平台,在群聊、直播场景下的技术实践

JackJiang

即时通讯 IM 群聊

架构师训练营 -week13-总结

大刘

极客大学架构师训练营

智能合约Dapp系统开发,区块链智能合约技术

薇電13242772558

区块链 智能合约

测开之数据类型· 第4篇《迭代器、生成器》

清菡软件测试

测试开发

海量小文件存储系统HOS探索与实践

Galaxy数据平台

大数据 OSS 对象存储 HBase GEEDGE NETWORKS

如何让组织文化不在虚无?

Alan

团队管理 个人提升 文化 28天写作

太牛了!在字节跳动我是如何当面试官的,Android篇

欢喜学安卓

android 程序员 面试 移动开发

字节首发Redis笔记,基础+原理+应用+源码+拓展五大核心模块

Java架构追梦

Java redis 编程 架构 面试

Himly TCC Dubbo 程序示例

Java 分布式事务 dubbo TCC Himly

03-week4-homework

J

极客大学架构师训练营

阿里9年老开发终于总结出微服务架构设计模式PDF了

小Q

Java 学习 编程 架构 面试

盘点2020 | 寒门难出贵子,我当程序员让爸妈在老家长脸了

爱笑的架构师

Java 程序员 程序人生 编程之路 盘点2020

互联网架构总结

J

极客大学架构师训练营

六度空间系统APP开发|六度空间软件开发(现成)

系统开发

2020年文章合集

Rayjun

光知道SpringBoot,不用thymeleaf就太不对了

小Q

Java 学习 编程 面试 Spring Boot

区块链落地应用开发- 珠宝溯源,不当“冤大头”

13828808769

区块链技术 区块链落地开发 珠宝溯源

冰河,能不能讲讲如何实现MySQL数据存储的无限扩容?

冰河

MySQL 分布式存储 海量数据 mycat 可扩展

架构师训练营 -week13-作业

大刘

极客大学架构师训练营

Databricks统一分析平台提供AutoML Toolkit_大数据_Srini Penchikala_InfoQ精选文章