写点什么

四种类型的数据分析模式

  • 2017-07-26
  • 本文字数:1227 字

    阅读完需:约 4 分钟

在这篇博文中,我们聚焦于在数据科学领域所遇到的四种类型的数据分析模式:描述型、诊断型、预测型和指导型。

当我与刚涉足数据科学领域的年轻分析师们交谈时,通常,我会问他们认为什么是数据科学家最重要的能力。他们的答案相当多样化。

我想告诉他们的是,他们最重要的能力将是能够把数据转化为对非专业人士而言清楚而有意义的见解。瑞典统计学家 Hans Rosling 在这方面很有名。这种能力往往被忽略。下面 Hans Rosling 的这个 TedTalk 谈到了这些:

https: // v.qq.com/x/page/g05293tyy78.html

分析能辅助开发有价值的见解,很有必要用一些工具来让人们了解分析所起的作用。其中一种工具是分析四维图。

简单地来说,分析可被划分为 4 个重要的类别。下面我将详细解释这四个类别。

1. 描述型:发生了什么?

这是最常见的一种。在业务中,它向分析师们提供业务的重要衡量标准的概览。

一个例子是每月的利润和损失账单。类似地,分析师可以获得大批客户的数据。了解客户(如,30% 的客户是自雇型)的地理信息也可认为是“描述型分析”。充分利用可视化工具能增强描述型分析所带来的信息。

2. 诊断型:为什么会发生?

这是描述型分析的下一步难题。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。

设计良好的商业信息 dashboard 整合了时间序列数据(譬如,在多个联系时间点上的数据)的读入、特征的过滤和钻入功能,能够用于这类分析。

3. 预测型:可能发生什么?

预测型分析主要是进行预测。某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。

预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。

在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。

这里是预测分析中要避免的前几大陷阱

4. 指导型:我需要做什么?

在价值和复杂度上,下一步就是指导性模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。

交通应用是一个很好的例子,它帮助人们选择最好的回家路线,考虑到了每条路线的距离、在每条路上的速度、以及很关键的目前的交通限制。

另一个例子是生成考试时间表,不让任何学生的时间表发生冲突。

关于作者

Thomas Maydon Principa 公司的信用解决方案部门主管。他在南非、西非和中东地区有着超过 13 年的零售信贷市场的经验,主要参与咨询、分析、信用局和预测模型服务。

查看英文原文 The 4 Types of Data Analytics


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-26 19:004437
用户头像

发布了 21 篇内容, 共 94934 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

避坑指南之财务共享服务中心的质量管理

用友BIP

财务共享

KaiwuDB 受邀亮相“ACDU 中国行”数据库技术沙龙(西安站)

KaiwuDB

KaiwuDB ACDB 中国行

GLTF编辑器实现逼真的石门模型

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

家页观察丨万华生态绿色化、工业化、数字化助力城市更新

Geek_2d6073

爆红的PLM!

用友BIP

PLM

赴一场AI星河之约:他们改变了什么?

脑极体

AI

云原生与持续交付:加速软件交付与部署的革命

范艺笙冉

IM通讯协议专题学习(十):初识 Thrift 序列化协议

JackJiang

网络编程 即时通讯 IM

江铃晶马 X 袋鼠云:搭建企业级数据资产中心,推进打造“智数晶马”

袋鼠云数栈

大数据 数据中台 数字化转型 案例 大数据平台

AI大模型时代下运维开发探索第二篇:基于大模型(LLM)的数据仓库

阿里云大数据AI技术

语音数据集:开启智能语音技术的新篇章

来自四九城儿

GLTF编辑器-位移贴图实现破碎的路面

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

语音数据集:智能语音技术的燃料与推动力

来自四九城儿

坚果的2023年终总结-激流勇进的一年

坚果

年终总结 坚果派

基于大数据、大模型的应用总结与技术心得

joe

3D 渲染如何帮助电商促进销售?

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

来聊聊程序员的职业发展路线

伤感汤姆布利柏

语音数据集:推动人工智能语音技术的关键要素

来自四九城儿

taobao.trade.memo.update( 修改交易备注 )丨淘宝店铺订单接口

tbapi

淘宝店铺订单接口 天猫店铺订单接口 淘宝店铺订单交易接口 淘宝店铺订单备注接口 天猫订单备注接口

Linux操作系统中软件安装:用RPM包管理器安装软件步骤

小魏写代码

写实风格3D模型材质贴图

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

GLTF 编辑器实现逼真3D动物毛发效果

3D建模设计

WebGL 3D渲染 three.js 材质纹理贴图 3D材质编辑

苹果Mac图像修图软件Photomator和Pixelmator Pro 有什么区别?

Rose

Pixelmator Pro Mac修图软件 Photomator

强大的磁盘分析:Disk Xray最新激活版

胖墩儿不胖y

Mac软件 磁盘分析软件 磁盘工具

百度CTO王海峰:文心一言用户规模破1亿

飞桨PaddlePaddle

人工智能 深度学习 WAVE SUMMIT

重庆中烟:事项会计驱动业财深度融合

用友BIP

业财融合

有了向量数据库,我们还需要 SQL 数据库吗?

Zilliz

sql 向量数据库 zillizcloud rag

好用的英语学习工具:Eudic欧路词典增强激活版中文

mac大玩家j

翻译软件 Mac软件 翻译工具

“边缘计算:从概念到实践的探索与思考“

future

LLM评估:通过7大指标监测并评估大语言模型的表现

Baihai IDP

程序员 AI ChatGPT LLM 白海科技

西部市场的无限潜力与成都的崛起“2024成都电子信息展会”

AIOTE智博会

电子展 电子信息展 成都电子展

四种类型的数据分析模式_语言 & 开发_CarolGuo_InfoQ精选文章