写点什么

微软发布了用于交互式数据探索和建模的数据科学工具

  • 2016-11-15
  • 本文字数:804 字

    阅读完需:约 3 分钟

微软最近发布了两个新的数据科学工具,用于交互式数据探索:建模和报告。这些数据科学工具被称为交互式数据探索、分析和报告(Interactive Data Exploration, Analysis and Reporting, IDEAR )和自动建模和报告(Automated Modeling and Reporting, AMAR )。数据科学团队可以通过这些数据科学工具在他们的项目中完成一些具体任务。

数据科学团队花了大量的时间写代码来回答数据相关的问题,如数据模式、丢失的数据元素、个体变量的分布和变换、在数据中特定的聚类模式以及机器学习(Machine Learning,ML)模型的性能等。这两个工具可以用来在数据科学的生命周期中将这些常见的任务自动化。其目标是在组织内的不同项目之间保持数据科学的一致性和完整性。

交互式数据探索:

IDEAR 工具可以用来探索、可视化和分析数据,并提供数据洞察。基于 R Studio Shiny 库,IDEAR 包含了数据导出和报告生成功能。数据导出功能可以保存相关的 R 脚本,生成可视化数据并保存到 R 日志文件中。用户可以运行 R 日志文件来自动生成数据报告。

IDEAR 的其他功能包括自动变量类型检测、变量排名和目标泄漏识别、可视化高维数据等。

自动建模和报告:

AMAR 用超参数扫描来训练机器学习模型,比较模型的准确性并评估变量的重要性。在一个参数输入文件中我们指定 ML 模型去运行,指定把哪些数据用于训练和测试,指定参数范围去扫描并且指定选择最佳参数的策略。

由 AMAR 工具生成的模型报告包含模型信息、模型评价和比较以及特征排名。

IDEAR 和 AMAR 工具在 CRAN-R 中运行,并能够在 GitHub 网站上找到。这个库是团队数据科学过程( Team Data Science Process ,TDSP)的一部分,上个月在微软的机器学习和数据科学峰会上被推出。

如果你有兴趣学习更多关于这些数据科学工具的内容,请查看微软Technet博客中的文章,或GitHub 网站上的Azure TDSP Utilities

查看英文原文 Microsoft Releases Data Science Tools for Interactive Data Exploration and Modeling

2016-11-15 18:002040
用户头像

发布了 152 篇内容, 共 72.2 次阅读, 收获喜欢 64 次。

关注

评论

发布
暂无评论
发现更多内容

C 语言中的 sscanf 详解

EquatorCoco

MySQL 数据库 C语言

某新员工大量使用Lambda表达式,老员工喷是炫技

源字节1号

小程序 开源 前端 后端

Autobots应用探索:实践中的思考与发现

京东科技开发者

S3基准测试工具 - Warp使用简介

天翼云开发者社区

测试 S3 开源云工具

基于快照的异步远程复制介绍

天翼云开发者社区

Java 前端 rbd

Objective-C 语言基础知识:编写测试代码

测吧(北京)科技有限公司

测试

官宣!玲珑项目升级,如意玲珑(Linyaps)全新启航!

nn-30

Linux 开源 操作系统 deepin deepin V23

京东按图搜索商品新视角:jd.item_search_img API返回值解读

技术冰糖葫芦

API 安全 API 文档 API 开发 API 协议

etl 常用数据类型转换 元数据配置说明

weigeonlyyou

Go 大数据 物联网 ETL MySQL 8.0

Java/OC 语言知识讲解:反射与回调

测吧(北京)科技有限公司

测试

Python循环控制

不在线第一只蜗牛

Python

rbd常用的配置参数

天翼云开发者社区

rbd 配置参数

云灾备场景

天翼云开发者社区

公有云 容灾场景

抖音商品详情API实战指南:轻松获取并利用商品数据

tbapi

抖音商品数据采集 抖音API 抖音数据采集 抖音商品详情接口

什么是云抄表?

源字节1号

小程序 开源 后端‘’

性能测试:行业流行性能剖析工具介绍

测吧(北京)科技有限公司

测试

没有它,你的Scrum无法实现!

敏捷开发

项目管理 Scrum 敏捷开发

Web 应用框架环境安装指南

测吧(北京)科技有限公司

测试

代码审查完整指南来了!

敏捷开发

编程 软件开发 代码审查 代码管理

测试平台环境配置指南

测吧(北京)科技有限公司

测试

天润融通用小改进,盘活大资产

天润融通

人工智能 天润融通

在 Xcode 中运行和调试单元测试:使用 Debug 和日志

测吧(北京)科技有限公司

测试

软件测试学习笔记丨接口请求体-form表单

测试人

软件测试

deepin Meetup 上海站回顾,揭秘如意玲珑(Linyaps)升级“内幕” | 附 PPT下载

nn-30

Linux 开源 操作系统 deepin deepin V23

AI大模型深度对比:腾讯混元大模型 VS 百川大模型

幂简集成

AI API 大模型

SQLAlchemy 安装与配置指南

测吧(北京)科技有限公司

测试

从校招新星到前端技术专家的成长之路

京东科技开发者

接入单元测试框架:原理与执行流程介绍

测吧(北京)科技有限公司

测试

为什么从 Demo 测试开始上手

测吧(北京)科技有限公司

测试

微软发布了用于交互式数据探索和建模的数据科学工具_微软_Srini Penchikala_InfoQ精选文章