产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

四种类型的数据分析模式

  • 2017-07-26
  • 本文字数:1227 字

    阅读完需:约 4 分钟

在这篇博文中,我们聚焦于在数据科学领域所遇到的四种类型的数据分析模式:描述型、诊断型、预测型和指导型。

当我与刚涉足数据科学领域的年轻分析师们交谈时,通常,我会问他们认为什么是数据科学家最重要的能力。他们的答案相当多样化。

我想告诉他们的是,他们最重要的能力将是能够把数据转化为对非专业人士而言清楚而有意义的见解。瑞典统计学家 Hans Rosling 在这方面很有名。这种能力往往被忽略。下面 Hans Rosling 的这个 TedTalk 谈到了这些:

https: // v.qq.com/x/page/g05293tyy78.html

分析能辅助开发有价值的见解,很有必要用一些工具来让人们了解分析所起的作用。其中一种工具是分析四维图。

简单地来说,分析可被划分为 4 个重要的类别。下面我将详细解释这四个类别。

1. 描述型:发生了什么?

这是最常见的一种。在业务中,它向分析师们提供业务的重要衡量标准的概览。

一个例子是每月的利润和损失账单。类似地,分析师可以获得大批客户的数据。了解客户(如,30% 的客户是自雇型)的地理信息也可认为是“描述型分析”。充分利用可视化工具能增强描述型分析所带来的信息。

2. 诊断型:为什么会发生?

这是描述型分析的下一步难题。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。

设计良好的商业信息 dashboard 整合了时间序列数据(譬如,在多个联系时间点上的数据)的读入、特征的过滤和钻入功能,能够用于这类分析。

3. 预测型:可能发生什么?

预测型分析主要是进行预测。某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。

预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。

在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。

这里是预测分析中要避免的前几大陷阱

4. 指导型:我需要做什么?

在价值和复杂度上,下一步就是指导性模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。

交通应用是一个很好的例子,它帮助人们选择最好的回家路线,考虑到了每条路线的距离、在每条路上的速度、以及很关键的目前的交通限制。

另一个例子是生成考试时间表,不让任何学生的时间表发生冲突。

关于作者

Thomas Maydon Principa 公司的信用解决方案部门主管。他在南非、西非和中东地区有着超过 13 年的零售信贷市场的经验,主要参与咨询、分析、信用局和预测模型服务。

查看英文原文 The 4 Types of Data Analytics


感谢杜小芳对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-07-26 19:004454
用户头像

发布了 21 篇内容, 共 95196 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

XML文档节点导航与选择指南

小万哥

xml 程序人生 编程语言 软件工程 前端开发

Linux虚拟网络设备:底层原理与性能优化深度解析

GousterCloud

Linux Kenel 设备驱动

打造银行核心全栈国产化新模式,第三届数字金融技术创新与应用研讨会成功举办

先锋IT

Ascend C 自定义算子 Kernel Launch调用入门

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号2024年4月PK榜 自定义算子开发

前端代码规范 - 日志打印规范

南城FE

JavaScript 前端开发 代码规范

LangChain Agent:赋予 LLM 行动力的神秘力量

蛋先生DX

#人工智能 LLM #LangChain AI Agent 企业号2024年4月PK榜

文心一言 VS 讯飞星火 VS chatgpt (232)-- 算法导论17.1 3题

福大大架构师每日一题

福大大架构师每日一题

避免IT项目延误的终极指南:揭秘10大原因及解决方案

爱吃小舅的鱼

项目管理 项目经理 IT项目管理

沙丘世界,如何抵抗勒索病毒的入侵?

白洞计划

网络安全

Linux虚拟网络设备深度解析:使用场景、分类与开发者指南

GousterCloud

Linux Kenel 虚拟网卡

虚拟网络设备性能优化

GousterCloud

Linux Kenel 虚拟网卡

心态崩了,约了半个月,就只有3个面试!

王中阳Go

微服务 并发编程 面试题 面经 大厂面经

云手机提供私域流量变现方案

Ogcloud

私域运营 私域流量运营 云手机 海外云手机 跨境云手机

用three.js做一个3D汉诺塔游戏(下)

OpenTiny社区

前端 three.js

解密组合监控:优化系统性能的关键策略

观测云

监控

常用Java代码混淆工具介绍及比较

雪奈椰子

一键生成视频!用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

阿里云大数据AI技术

人工智能 阿里云 AI视频

虚拟网络设备的真正使命:实现有控制的通信

GousterCloud

Linux Kenel

虚拟网络设备与网络安全:深入分析与实践应用

GousterCloud

Linux Kenel 虚拟网卡

随易周刊第002期 - 四象

前端之虎陈随易

程序员 前端 Web 周刊 技术周刊

掌握Linux虚拟网络设备:从基础到应用的全面指南

GousterCloud

Linux Kenel 网络设备

Linux虚拟网络设备全景解析:定义、工作模式与实践应用

GousterCloud

Linux Kenel 设备

MySQL 主从 AUTO_INCREMENT 不一致问题分析

快乐非自愿限量之名

MySQL 数据库

体育赛事直播系统源码,用于搭建平台的价值与优势

软件开发-梦幻运营部

微服务架构下,如何通过弱依赖原则保障系统高可用?

京东零售技术

Java 架构 后端 企业号 4 月 PK 榜

Kafka 线程模型痛点攻克: 提升分区写入 2 倍性能

AutoMQ

Apache 云计算 大数据 kafka

虚拟网络设备与Linux网络协议栈

GousterCloud

Linux Kenel

✅基于TTL 解决线程池中 ThreadLocal 线程无法共享的问题

派大星

ThreadLocal Java 面试题 互联网大厂面试

信息泄露漏洞的JS整改方案

嵌入式会越来越卷吗?

梦笔生花

嵌入式 嵌入式软件 嵌入式应用

虚拟网络设备的网络隔离机制:原理、意义与应用场景深度分析

GousterCloud

Linux Kenel 网卡

四种类型的数据分析模式_语言 & 开发_CarolGuo_InfoQ精选文章