写点什么

为数据治理构建数据成熟度模型

  • 2007-09-10
  • 本文字数:1425 字

    阅读完需:约 5 分钟

在横跨 5 天的 5 篇博文中,数据治理博客提供了一个开发数据成熟度模型的快速入门指南。与先前建立数据治理成熟模型的方法的有趣的不同点是:它提倡一个为给定的组织量身定做适当的模型,而不是试图为了统一而应用标准模型。在这个 5 部分组成的数据治理系列中,开始部分关注定义范围,建立基线。在给你的数据建立一个成熟度模型时,首先在你的企业数据中划定要治理的那部分数据是非常有必要的。一旦数据的范围定义好了,就需要给它建立一个基线。见专题中的:

什么是你的数据集中成熟度级别最低的数据?你的回答可能是沿袭这条思路:未被审查的、没有被建模的,没有元数据、不知道它是什么的”,“它虽然在我们的协助数据模型中,但是除了字段名外没有其他信息,没有元数据”,或者“它在我们的模型中,我们有一些过时的定义,而且我们也不再认为它是可信赖的” 这可能会花费很多的时间,但最重要的是为它建立一个基线。需要捕获的主要内容是:

  1. 它在你的数据模型中吗?
  2. 你给它的元数据了吗?
  3. 如果有元数据,你信任元数据中的信息吗?

在第 2 天,介绍了数据成熟度模型的自然级数:

你现在要寻找的是你能看到的数据当前所处于的级别。从最低的级别开始,你能够看到的在成熟度中的下一个位置在哪里?如果你的起始级别是“未建模的、没有元数据、不知道它是什么的”,你的数据所能看到的下一步可能是“属于我们的数据模型但是我们对它获得不了其他的辅助信息”……与其建立一个需要强制我们的数据去适应它的数据成熟度模型,不如让我们用数据已经存在的不同的阶段来定义成熟度的路径。

3 篇 blog 把关注重点从最低级的成熟度转向最高级的成熟度,并试图使用一致的术语来架越鸿沟:

其实,我想让你做的是拿出你在第一天得到的内容并写下与它完全相反的内容,这个会帮助你确定最高的成熟度级别。所以,如果你的最低级别是:“未建模的,未被评审的,没有元数据的”,那么最适宜的最高级别应该是“数据模型经过了数据治理委员会评审和治理过的,验证过了数据模型并进行了及时更新”。这样做会让你的成熟度模型框定相同的项目。如果你在讨论你的最低级别的数据模型,你应该讨论包括最高级别在内的其他级别。

在第 4 篇博文中提供了成熟度模型可用的模板, 第 4 5 两篇博文带你领略如何为你的组织量身定制合适的成熟度模型。

先从最重要的事情开始,完成下列内容:填写你的数据治理成熟度模型模板,找出你的程序中的范围内数据。 下面要做的是从你的数据中取样,并确保你能从成熟度模型中轻松的为其进行定位。如果再让我我来做这步工作的话,我会随机的挑选出 40 个字段并逐一进行检查。我会查看这些字段,检查模型,检查它们是否拥有元数据等,并看它们是否可以属于某个级别。你需要确保所有这些数据字段都在成熟度模型中找到了归属位置。如果在这其中发生了生命问题,说明你还没有完全清晰的定义好了你的等级。如果它们同时被分到了两个级别中,你需要定义一个新的级别来说明其中的不同,或者根据它的特征合并到你其中一个已经存在的级别中。

查看英文原文: Building a Data Maturity Model for Data Governance - - - - - -

译者简介:孙向晖,儿子小名“豆豆”,常被人称为“豆豆他爹”。1998 年开始步入 IT 行业,现任浪潮软件质保中心副主任。专注于研究和实践 MDA/UP/UML/SCM 等相关技术在团队中的大规模应用,对产品化的软件项目管理、需求管理和配置管理略有心得。他的博客为 http://blog.csdn.net/xiaosun/ 。参与 InfoQ 中文站内容建设,请邮件至 china-editorial[at]infoq.com

2007-09-10 21:363304

评论

发布
暂无评论
发现更多内容

maven私服搭建与插件开发

IT视界

maven nexus

百度VidPress Sports团队获SoccerNet-v2足球视频理解竞赛双料冠军

百度大脑

人工智能 欧洲杯 足球

【GOTC 预告】王思宇:从 OpenKruise 看云原生应用负载发展趋势

阿里巴巴云原生

字节跳动这份面试题,你能打几分

Java 面试

Qunar DNS体系建设

Qunar技术沙龙

DNS DNS服务器

同程旅行基于 RocketMQ 高可用架构实践

阿里巴巴云原生

抑制不住的喜悦!耗时2个月整理的Java面试指南在Github上破百万star!

Java架构师迁哥

阿里JDK源码小册(2021版)火了!下载量超60W次!

Java架构师迁哥

SpringBoot 拦截器妙用,让你一个人开发整个系统的鉴权模块!

陈皮的JavaLib

Java 面试 springboot

超24W字,2021最新一线大厂Java高级架构师面试题总结,共计480页

Java架构师迁哥

2021值得考虑的一类新型微服务架构:ServiceMesh

BoCloud博云

微服务

tms大时代APP开发|tms大时代软件系统开发

Flink 1.13,面向流批一体的运行时与 DataStream API 优化

Apache Flink

flink

新一代设计编排运维套件分享

鲸品堂

运维 价值

碳达峰碳中和目标下,区块链如何赋能能源管理?

旺链科技

连夺十冠!百度CVPR 2021再突破,AI实力接受国际“检验”

百度大脑

人工智能

“创客北京2021”百度飞桨AI产业创新应用专项赛报名啦

百度大脑

人工智能 大数据

Linux内核移植

学神来啦

云计算 Linux 运维 运维自动化

Hi.com嗨币软件系统开发资料

Ubuntu 20.04安装/更新升级后进系统黑屏,屏幕亮度无法调节踩坑记

玏佾

ubuntu Ubuntu20.04 无法进入系统 驱动 屏幕亮度

为什么有些人不喜欢低代码?

优秀

低代码

33岁公司倒闭,被迫走上大龄Java程序员求职之路

Java架构师迁哥

党建百年,矛盾论指导架构设计

三石

架构设计

Flink 1.13,State Backend 优化及生产实践分享

Apache Flink

flink

Go学习笔记之Hello World

架构精进之路

语言 Go 语言 7月日更

数据结构——顺序队列

若尘

数据结构 队列

AI技术在银行内部反欺诈中应用的新思路

索信达控股

人工智能 大数据 金融科技 风控 反欺诈 人工智能模型

收藏吃灰系列!阿里内部“SpringCloudAlibaba学习笔记”这细节讲解,神了

Java 程序员 架构 面试 微服务

腾讯云,拿什么获得电商行业信赖?

ToB行业头条

#腾讯云

难得一次技术面,Java程序员开发七年,突破自己终获小米offer

Java 程序员 架构 面试

GitHub上最火的7个spring cloud开源项目,对新手太友好了

北游学Java

Java 微服务 Spring Cloud 项目源码

为数据治理构建数据成熟度模型_治理_Mark Figley_InfoQ精选文章