写点什么

Databricks 统一分析平台提供 AutoML Toolkit

  • 2019-10-26
  • 本文字数:783 字

    阅读完需:约 3 分钟

Databricks统一分析平台提供AutoML Toolkit

DatabricksApache Spark数据分析引擎的母公司)最近发布了统一数据分析平台,其中包括一个名为AutoML Toolkit的自动化机器学习工具。


通过自动化数据科学工作流的各个步骤——包括特征工程、超参数调优、模型搜索和部署——以获得完全受控和透明的增强 ML 体验。该工具包可用于帮助数据科学团队提高生产效率。这是Databricks实验室提供的面向公民和专家数据科学家的定制化解决方案。在MLflow中,AutoML 工具包的执行会被自动跟踪。


Databricks 实验室项目是一个实验性的端到端监督学习解决方案,用于自动化特征清理、特征向量化、模型选择和训练、超参数优化和选择、批量预测以及记录模型结果和训练运行等步骤。


统一分析平台主要包括以下三个组件:


  • Databricks 工作区:以统一数据科学和工程为目标,工作区利用共享交互式笔记本、工具和 API 处理所有分析过程(从 ETL 到模型训练和部署)。

  • Databricks 运行时:运行时组件帮助进行数据准备,并持续训练和部署 AI/ML 应用程序的模型。它支持Hyperopt、MLlib和MLflow之间的集成,从而支持分布式有条件的超参数调优、自动跟踪和增强的可视化。开始时,用户可以使用预配置的集群,包括一些流行的 ML 框架,如HadoopKafka、Spark、ParquetTensorFlowKerasScikit Learn

  • Databricks 云服务:云服务通过在云上提供完全托管的服务来帮助管理基础设施的复杂性。云服务包括微软Azure集成和 Amazon Web Services(AWS)。


Databricks 还提供与第三方机器学习工具的集成,如H2OSparkling WaterDataRobotXGBoost


要了解有关新的分析平台和 AutoML toolkit 的更多信息,请查看以下资源:



原文链接


Databricks’ Unified Analytics Platform Supports AutoML Toolkit


2019-10-26 08:002390

评论

发布
暂无评论
发现更多内容

海量小文件传输对于企业选用文件传输软件的重要意义

镭速

文件传输 海量小文件传输

新材料生产工厂MES系统选型指南

万界星空科技

MES系统

GreptimeDB 使用指南 | 3 分钟快速下载启动时序数据库

Greptime 格睿科技

数据库 时序数据库 Greptime GreptimeDB

探索GameFi局势:利用代币经济学应对可持续发展挑战

区块链软件开发推广运营

交易所开发 数字藏品开发 dapp开发 区块链开发 NFT开发

对话在行人|中亿丰(上):基于数智化中台推动业财融合

用友BIP

2023全球商业创新大会 对话在行人

2023年软件开发领域的发展趋势

树上有只程序猿

软件开发

“连理”升空 OpenHarmony开启国产卫星系统星辰大海

最新动态

打造全球司库新范式,用友践行产融数智化转型之洞见

用友BIP

全球司库

软件测试/测试开发丨Jenkins Pipeline 学习笔记

测试人

软件测试 jenkins CI/CD pipeline 测试开发

荣誉拉满!国云向新,“算”出新未来!

天翼云开发者社区

云计算

小米 AR 运动主机「15 分钟消耗一碗米饭」;互联网行业平均薪资降至 3 万档丨RTE开发者日报 Vol.45

声网

效率提升与智能化的新机遇

百度开发者中心

人工智能 大数据 文心一言

Python程序设计实例 | 条形码图片识别

TiAmo

Python 条形码识别 条形码

软件测试/测试开发丨Python 深拷贝与浅拷贝

测试人

Python 软件测试 自动化测试 深拷贝 浅拷贝

用友全球化数智运营解决方案:构建企业出海竞争力

用友BIP

中企出海 升级数智底座

昇腾实践丨ATC模型转换动态shape问题案例

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号9月PK榜

“国云入闽 数耀鹭岛”,中国电信天翼云创新助力数字福建新征程!

天翼云开发者社区

人工智能 云计算

Databricks统一分析平台提供AutoML Toolkit_大数据_Srini Penchikala_InfoQ精选文章