写点什么

微软发布了用于交互式数据探索和建模的数据科学工具

  • 2016-11-15
  • 本文字数:804 字

    阅读完需:约 3 分钟

微软最近发布了两个新的数据科学工具,用于交互式数据探索:建模和报告。这些数据科学工具被称为交互式数据探索、分析和报告(Interactive Data Exploration, Analysis and Reporting, IDEAR )和自动建模和报告(Automated Modeling and Reporting, AMAR )。数据科学团队可以通过这些数据科学工具在他们的项目中完成一些具体任务。

数据科学团队花了大量的时间写代码来回答数据相关的问题,如数据模式、丢失的数据元素、个体变量的分布和变换、在数据中特定的聚类模式以及机器学习(Machine Learning,ML)模型的性能等。这两个工具可以用来在数据科学的生命周期中将这些常见的任务自动化。其目标是在组织内的不同项目之间保持数据科学的一致性和完整性。

交互式数据探索:

IDEAR 工具可以用来探索、可视化和分析数据,并提供数据洞察。基于 R Studio Shiny 库,IDEAR 包含了数据导出和报告生成功能。数据导出功能可以保存相关的 R 脚本,生成可视化数据并保存到 R 日志文件中。用户可以运行 R 日志文件来自动生成数据报告。

IDEAR 的其他功能包括自动变量类型检测、变量排名和目标泄漏识别、可视化高维数据等。

自动建模和报告:

AMAR 用超参数扫描来训练机器学习模型,比较模型的准确性并评估变量的重要性。在一个参数输入文件中我们指定 ML 模型去运行,指定把哪些数据用于训练和测试,指定参数范围去扫描并且指定选择最佳参数的策略。

由 AMAR 工具生成的模型报告包含模型信息、模型评价和比较以及特征排名。

IDEAR 和 AMAR 工具在 CRAN-R 中运行,并能够在 GitHub 网站上找到。这个库是团队数据科学过程( Team Data Science Process ,TDSP)的一部分,上个月在微软的机器学习和数据科学峰会上被推出。

如果你有兴趣学习更多关于这些数据科学工具的内容,请查看微软Technet博客中的文章,或GitHub 网站上的Azure TDSP Utilities

查看英文原文 Microsoft Releases Data Science Tools for Interactive Data Exploration and Modeling

2016-11-15 18:002114
用户头像

发布了 152 篇内容, 共 73.5 次阅读, 收获喜欢 64 次。

关注

评论

发布
暂无评论
发现更多内容

ARouter 拦截器之多 module 独立运行

逆锋起笔

android 组件化 arouter

软件架构设计原则之单一职责原则

Tom弹架构

Java 架构 设计模式 设计原则

k8s replicaset controller源码分析(3)-expectations机制分析

良凯尔

Kubernetes 源码分析 Kubernetes源码 #Kubernetes#

京东架构师珍藏版:redis深度笔记(全彩版)全篇精华,细节满满

Java 程序员 架构 面试 rediis

Spring版本命名规则

Tom弹架构

Java spring 架构

架构实战营模块一作业

spark99

架构实战营

Spring 5系统架构

Tom弹架构

Java spring 架构

官方线索|Bilibili1024程序员节

搬砖人

1024我在现场

软件架构设计原则之合成复用原则

Tom弹架构

Java 架构 设计模式 设计原则

设计原则学习笔记

风翱

设计原则 10月月更

前端应用部署k8s的平滑发布问题

小江

k8s 大前端 发布流程

又真香了!到底是怎样的JAVA面试文档,拿到这么多offer

Java 编程 程序员 面试

架构实战营模块6课后作业 拆分电商系统为微服务

apple

普通本科毕业一年,刷完这1000道JAVA面试题,成功逆袭上岸

Java 编程 程序员 面试 大厂面试

分布式事务开山之作——《深入理解分布式事务:原理与实战》草图曝光!!

冰河

数据库 分布式 分布式事务 微服务 数据一致性

软件架构设计原则之依赖倒置原则

Tom弹架构

Java 架构 设计模式 设计原则

weblogic 报 java.lang.OutOfMemoryError:PermGen space

看山

Java 10月月更

拆分电商系统微服务

毛先生

不是吧?阿里“百万级”性能优化小册居然能让系统运行得这么快

Java 编程 程序员 性能优化

架构实战训练营模块一

人生就是梦

架构实战营

软件架构设计原则之接口隔离原则

Tom弹架构

Java 架构 设计模式 设计原则

架构实战营 - 模块六作业

Alex.Wu

架构实战训练营|课后作业|模块 6

Frode

「架构实战营」

软件架构设计原则之迪米特法则

Tom弹架构

Java 架构 设计模式 设计原则

软件架构设计原则之里氏替换原则

Tom弹架构

Java 架构 设计模式 设计原则

架构实战营 - 模块六作业

en

#架构实战营

软件架构设计原则之开闭原则

Tom弹架构

Java 架构 设计模式 设计原则

面试官:如何回答消息队列的丢失、重复与积压问题

Java 程序员 架构 面试

在 Vue3中使用Fabric.js实现渐变(Gradient)效果,包括径向渐变radial

德育处主任

JavaScript 大前端 vite Vue3 FabricJS

Generic Type Variance in Dart

Think

flutter dart 泛型

k8s replicaset controller源码分析(2)-核心处理逻辑分析

良凯尔

Kubernetes 源码分析 Kubernetes源码 #Kubernetes#

微软发布了用于交互式数据探索和建模的数据科学工具_微软_Srini Penchikala_InfoQ精选文章