AICon上海|与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用 了解详情
写点什么

微软发布了用于交互式数据探索和建模的数据科学工具

  • 2016-11-15
  • 本文字数:804 字

    阅读完需:约 3 分钟

微软最近发布了两个新的数据科学工具,用于交互式数据探索:建模和报告。这些数据科学工具被称为交互式数据探索、分析和报告(Interactive Data Exploration, Analysis and Reporting, IDEAR )和自动建模和报告(Automated Modeling and Reporting, AMAR )。数据科学团队可以通过这些数据科学工具在他们的项目中完成一些具体任务。

数据科学团队花了大量的时间写代码来回答数据相关的问题,如数据模式、丢失的数据元素、个体变量的分布和变换、在数据中特定的聚类模式以及机器学习(Machine Learning,ML)模型的性能等。这两个工具可以用来在数据科学的生命周期中将这些常见的任务自动化。其目标是在组织内的不同项目之间保持数据科学的一致性和完整性。

交互式数据探索:

IDEAR 工具可以用来探索、可视化和分析数据,并提供数据洞察。基于 R Studio Shiny 库,IDEAR 包含了数据导出和报告生成功能。数据导出功能可以保存相关的 R 脚本,生成可视化数据并保存到 R 日志文件中。用户可以运行 R 日志文件来自动生成数据报告。

IDEAR 的其他功能包括自动变量类型检测、变量排名和目标泄漏识别、可视化高维数据等。

自动建模和报告:

AMAR 用超参数扫描来训练机器学习模型,比较模型的准确性并评估变量的重要性。在一个参数输入文件中我们指定 ML 模型去运行,指定把哪些数据用于训练和测试,指定参数范围去扫描并且指定选择最佳参数的策略。

由 AMAR 工具生成的模型报告包含模型信息、模型评价和比较以及特征排名。

IDEAR 和 AMAR 工具在 CRAN-R 中运行,并能够在 GitHub 网站上找到。这个库是团队数据科学过程( Team Data Science Process ,TDSP)的一部分,上个月在微软的机器学习和数据科学峰会上被推出。

如果你有兴趣学习更多关于这些数据科学工具的内容,请查看微软Technet博客中的文章,或GitHub 网站上的Azure TDSP Utilities

查看英文原文 Microsoft Releases Data Science Tools for Interactive Data Exploration and Modeling

2016-11-15 18:002154
用户头像

发布了 152 篇内容, 共 74.1 次阅读, 收获喜欢 64 次。

关注

评论

发布
暂无评论
发现更多内容

区块链项目外包开发流程

北京木奇移动技术有限公司

区块链技术 智能合约开发 软件外包公司

区块链RWA软件项目的开发

北京木奇移动技术有限公司

区块链技术 软件外包公司 RWA开发

2025-01-01:优质数对的总数Ⅰ。用go语言,给定两个整数数组 nums1 和 nums2,分别长度为 n 和 m,以及一个正整数 k。 如果 nums1 数组中的元素 nums1[i] 能被

福大大架构师每日一题

福大大架构师每日一题

Flexus X实例评测使用体验——手把手带你体验瑞吉外卖下载与部署

YG科技

华为FlexusX与Docker+Nginx的高效整合之路

YG科技

Flexus X初体验之部署xxl-job - 分布式任务调度平台

YG科技

华为Flexus云服务器X实例实测-堡垒机jumpserver

YG科技

华为云Flexus X实例部署k3s与kuboard图形化管理工具

YG科技

Flexus云服务X实例安装ODBC驱动,在ODBC中建立MySQL数据库连接,通过QT连接云数据库

YG科技

镜舟科技荣获 IT168 2024年度创新产品奖!

镜舟科技

开源 分析型数据库 StarRocks IT168 物化视图

华为音乐2024年度听歌报告:与鸿蒙用户共同漫步音乐花园

最新动态

华为云Flexus云服务器X实例全面使用操作指南

YG科技

华为云Flexus X加速Redis案例实践与详解

YG科技

探索未来算力新纪元——带你体验Kafka、Zookeeper集群安装

YG科技

遥遥领先的华为云Flexus云服务器X它来了~~~~

YG科技

使用sysbench对华为云Flexus服务器X做Mysql应用加速测评

YG科技

《计算机组成及汇编语言原理》阅读笔记:p160-p176

codists

计算机组成及汇编语言原理

从AI远见到中国速度:Scaling Law发现者为何引全球热议?

脑极体

AI

自学记录鸿蒙API 13:PreviewKit从文件预览到应用开发

李游Leo

鸿蒙 HarmonyOS NEXT

Flexus云服务器X,云上性能新飞跃,开启业务增长新纪元

YG科技

华为云Flexus云服务器X实例部署Mininote轻量级笔记工具

YG科技

区块链ETF软件的开发

北京木奇移动技术有限公司

区块链技术 软件外包公司 ETF

Flexus云服务X实例应用,通过QT连接华为云MySQL,进行数据库的操作,数据表的增删改查

YG科技

自学记录:鸿蒙5使用ArkTS和ArkUI实现Live View功能

李游Leo

鸿蒙 HarmonyOS HarmonyOS NEXT

AKI跨语言调用库让C/C++代码迁移至HarmonyOS NEXT更高效

最新动态

小鲸数据:2024 AI 年度洞察

小鲸数据

AI应用 生成式 #大模型 #AI #AIGC

微软发布了用于交互式数据探索和建模的数据科学工具_微软_Srini Penchikala_InfoQ精选文章