写点什么

微软发布了用于交互式数据探索和建模的数据科学工具

  • 2016-11-15
  • 本文字数:804 字

    阅读完需:约 3 分钟

微软最近发布了两个新的数据科学工具,用于交互式数据探索:建模和报告。这些数据科学工具被称为交互式数据探索、分析和报告(Interactive Data Exploration, Analysis and Reporting, IDEAR )和自动建模和报告(Automated Modeling and Reporting, AMAR )。数据科学团队可以通过这些数据科学工具在他们的项目中完成一些具体任务。

数据科学团队花了大量的时间写代码来回答数据相关的问题,如数据模式、丢失的数据元素、个体变量的分布和变换、在数据中特定的聚类模式以及机器学习(Machine Learning,ML)模型的性能等。这两个工具可以用来在数据科学的生命周期中将这些常见的任务自动化。其目标是在组织内的不同项目之间保持数据科学的一致性和完整性。

交互式数据探索:

IDEAR 工具可以用来探索、可视化和分析数据,并提供数据洞察。基于 R Studio Shiny 库,IDEAR 包含了数据导出和报告生成功能。数据导出功能可以保存相关的 R 脚本,生成可视化数据并保存到 R 日志文件中。用户可以运行 R 日志文件来自动生成数据报告。

IDEAR 的其他功能包括自动变量类型检测、变量排名和目标泄漏识别、可视化高维数据等。

自动建模和报告:

AMAR 用超参数扫描来训练机器学习模型,比较模型的准确性并评估变量的重要性。在一个参数输入文件中我们指定 ML 模型去运行,指定把哪些数据用于训练和测试,指定参数范围去扫描并且指定选择最佳参数的策略。

由 AMAR 工具生成的模型报告包含模型信息、模型评价和比较以及特征排名。

IDEAR 和 AMAR 工具在 CRAN-R 中运行,并能够在 GitHub 网站上找到。这个库是团队数据科学过程( Team Data Science Process ,TDSP)的一部分,上个月在微软的机器学习和数据科学峰会上被推出。

如果你有兴趣学习更多关于这些数据科学工具的内容,请查看微软Technet博客中的文章,或GitHub 网站上的Azure TDSP Utilities

查看英文原文 Microsoft Releases Data Science Tools for Interactive Data Exploration and Modeling

2016-11-15 18:002075
用户头像

发布了 152 篇内容, 共 72.8 次阅读, 收获喜欢 64 次。

关注

评论

发布
暂无评论
发现更多内容

让每笔营销费用发挥更大价值,为生意持续增长创造可预见的未来!

赛博威科技

数字营销 营销费用管理 赛博威

小程序SDK在跨端app开发是否有优势?

FinFish

跨端应用开发 小程序容器技术 跨端技术 跨端app开发 小程序SDK

什么工具可以解决团队协作障碍?

秃头小帅oi

签约案例|GreptimeDB 为数据驱动的汽车应用带来安全高效的车云一体解决方案

Greptime 格睿科技

数据库 车联网 汽车 车云一体

NFTScan | 11.25~12.01 NFT 市场热点汇总

NFT Research

NFT\ NFTScan

Web自动化测试中的元素定位与显式等待

测试人

软件测试

中国恩菲:有色金属行业如何使用 IoTDB?|用户零距离第一期

Apache IoTDB

官方提供平台,导师倾情陪练,助力学生玩转开源|Greptime 参与「开源之夏」的第二年正式收官!

Greptime 格睿科技

数据库 开源 活动 开源之夏

如何选择团队网盘?企业常用的8款工具盘点

易成研发中心

怎么把域名解析到IP地址上?怎么去设置域名解析?

国科云

CDN的作用以及哪些企业适合使用CDN?

Ogcloud

CDN 网络加速 CDN加速 CDN技术 CDN网络加速

打造去中心化交易平台:公链交易所开发全解析

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

云服务器的故障率比物理服务器更低吗?

Ogcloud

云主机 云服务器 香港云服务器 美国云服务器 云服务器租用

Spring Cloud+Nacos+KMS 动态配置最佳实践

阿里巴巴云原生

阿里云 云原生

掌握API开发:分步实操技巧

幂简集成

API 入门指南

明基 RD280U显示器——程序员之选

Yan-英杰

程序员

赛博威数字营销一体化高效运维,更高效、更全面、更稳定、更创新

赛博威科技

运维 数字营销 赛博威

手撕单例的 5 种写法!

王磊

Java面试无分布式微服务经验,该如何弥补?

了不起的程序猿

分布式 微服务 后端 架构师 java面试

ETL工具观察:ETLCloud与MDM是什么关系?

RestCloud

系统集成 ETL 数据集成 MDM

与火山引擎合作深化,观测云携一站式监控解决方案登陆万有商城

观测云

火山引擎

赛博威携手百度智能云,开启数字营销新未来

赛博威科技

人工智能 AI 百度智能云 数字营销 赛博威

Java日志手机号脱敏工具类

EquatorCoco

Java 工具

一线GPMI,牵动智能大屏;一触星闪,点亮万家欢声

脑极体

AI

TinyPro Vue 1.1.0 正式发布:增加细粒度权限、页签模式、多级菜单,支持Vite/Rspack/Farm等构建工具

OpenTiny社区

开源 前端 组件库 OpenTiny TinyVue

Hume AI 语音控制功能:创建个性化语音;李飞飞空间智能首个模型:单图生成 3D 交互场景丨 RTE 开发者日报

声网

OKR工作法软件大盘点,7款优秀工具助力目标管理

易成研发中心

企业如何构建自己的 AI 编码能力

腾讯云 AI 代码助手

编码 #人工智能 腾讯云AI代码助手 #AI #大语言模型

SOL项目开发代币Dapp的基本要求

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 交易所开发代币开发

深入编码规则:构建灵活且可扩展的编号生成器

inBuilder低代码平台

低代码

微软发布了用于交互式数据探索和建模的数据科学工具_微软_Srini Penchikala_InfoQ精选文章