一位数据库专家探索数据治理的本质

数据架构师: 您要管理什么?(什么是数据架构师)  数据 架构师 第1张

Robert Catterall 是一位数据库专家,他想确认完成数据管理的必要性。在 IBM Information Governance Solutions 的主管 Steven Adler 的协助下,他探究了数据管理的准则以及它怎么协助数据库团队。

我是一位数据库作业者(更精确地说,是 DB2 作业者)。我的作业处于 IBM Information Management 软件组合的低层。假如说那些从事剖析、主数据管理、数据集成和其他高层软件技能的人是数据巨轮的高档船员,他们站在舰桥上,穿戴带金色肩章的白制服,用双筒望远镜了望远方,那么我是在轮机舱作业。当舰桥上传来指令,指令我加速数据活动的速度时,我答复说,“咱们现已到极限了,船长!” … 可是我依然要想办法完成使命。你们成天议论战略和形式,而我议论的是比特和字节、速度和供给。欢迎来到我的国际。好了,不打比如了,咱们来评论实践问题吧!

我从前遇到过许多貌同实异的概念,最近遇到的一个是 “数据管理”。对不住,长官,可是这听起来是针对某个问题的处理方案。让我告知您一个小秘密:数据是没有自主行动力的,这意味着它不需求 “管理”。它需求操控,我和我的朋友们可以敷衍,谢谢您。请找其他什么东西去 “管理” 吧!

您说什么?您在谈到管理数据时,实践上是方案管理其他什么东西?OK,现在我感兴趣了。请多说点儿,我洗耳恭听。

要点在于人

关于数据管理,我应该听取谁的定见?没人比 Steve Adler 更适宜了,他是 IBM Information Governance Solutions 的主管和 IBM Information Governance Council 的主席。他在电话上告知我 “数据管理” 这个词在修辞方面的矛盾性实践上是有意义的:它提示人们提出问题。“‘数据管理’ 究竟是什么意思?” 说话就此展开了。Adler 指出,真实的方针是对行为进行管理。

人与数据库交互:他们引导数据流的走向;他们解说并处理数据恳求。人也会犯错 — 常常是由于他们选用的进程和依托的应用程序体系有缺点 — 这会在信息管道中引进过错,给下流构成数据质量问题。Adler 指出,数据管理的目的主要是体系化地找到并处理或许引进过错的点。方针是构成决议方案者可以信赖的数据 — 还要向他们供给数据可信的证明。

这是一个很不错的说词。但在参加您的作业之前,我想看看 “蓝色伟人” 是怎么吃 “废物食物” 的。Adler 问我是否了解 IBM 的产品目录。我的确了解 — 究竟我为 IBM 作业了 17 年。IBM 有很多信息,有多达 1.2 亿条记载。明显,这些记载中很大一部分包括过错的信息:过错、缺失和未及时发布的数据。在 255 个 IBM 产品公告中,只需 5 个彻底没有过错。这真是让人震慑的统计数字。

为了找出数据质量问题的来历,团队在通向出产数据库的数据流中不同的方位上设置 “捕捉器”。捕捉器协助团队发现在特定条件下或许发生的过错。找出问题的原因之后,团队就可以规划和完成根据进程和根据技能的处理方案,然后消除不精确的信息的来历。

不是我的问题(或许是?)

我想,只需消除或许导致数据质量问题的条件就行了,所以由您担任。我期望您成功。不需求围着我和 DBA 看管的数据库打转 — 它们很牢靠。有多牢靠?精确度至少有 99.9%。我议论的数据库有多少数据记载?出产数据库或许有超越 10 亿条记载。是的,由于数据库规划如此之大,虽然过错率十分低,过错数量依然相当大。好吧,您说的有道理。在数据库内部和周围放上一些捕捉器或许是好主意。

Adler 说,可是不要就此停步,由于数据质量问题不仅仅是数据记载不精确。有时候,急切的问题是有必要处理数据分类。例如,一个安排经过并购构成了更大的规划,终究经过多个事务线为更大型的企业客户供给服务。客户公司之一诉苦说,当他们经过不搭档务线的代表向服务供给安排提出同一个问题时,却得到了不同的答复。这是由于关于不同的事务线,相同术语的意义不同。这是数据界说问题 — 数据管理要经过有用的主数据管理 (MDM) 消除此类问题。

怎么从 A 到 B?

我供认,我开端看出数据管理的一些价值了。这个概念不像我开始以为的那么不知所谓。可是,看到潜在价值和获得实践价值是两回事儿。怎么经过数据管理作业获取价值?从哪里做起?怎么推进不断前进?

Adler 告知我他喜爱的办法分为六个进程:

确认方针。一些方针可以有变化,其他方针是固定的(例如处理数据质量问题)。是的 — 在动身之前,有必要清晰要去哪里。

确认要衡量什么。假如想要前进数据质量,那么怎么可以知道是否现已获得了前进?或许要查看存储库中必定份额的文档,记载信息不正确或缺失的状况。决议衡量的进程和条件关于评价基线状况和盯梢进程很重要。我了解了。说说简单:假如想要说服人,就要供给数字。

了解安排的决议方案模型。是独裁模型?代表模型?仍是民主模型?无论是哪种,它合适您的公司吗?您正在开发的数据管理战略支撑这种决议方案模型吗?决议方案 “更好” 的意义是什么?需求做出很多决议方案吗?仍是要更快地做出决议方案?我想,在改善数据质量时,总是要花时刻评价数据在自己的环境中怎么驱动决议方案。或许会发现需求改善的东西。

有用地传达数据管理战略。怎么把战略的相关信息告知相关人员和感兴趣的其他各方?经过电子邮件?经过时势通讯?不能只依托搭档之间的口头沟通。

衡量成果。数据管理战略获得的实践效果怎么?假如现已拟定了衡量发展的方案(这个列表中的第二项),那么得到详细的数字应该不太困难。解说这些数字会很有意思。

查看整个数据管理作业。是否选用了恰当的进程?是否应用了恰当的技能?是否完成了有用的操控?“查看” 这个词有点儿让我不舒服,可是我知道关于战略来说这是不行短少的,无论是数据管理战略仍是其他战略。我不喜爱评判他人的作业,可是我了解有时候需求这么做。

这些是十分高档的查看项,详细的项目方案应该远远不只六个进程。可是,在面临杂乱的使命时,以恰当办法对难题进行拆分的确有助于清晰作业要点。关于我来说,Adler 的办法看起来是不错的问题拆分办法。可以以此为基础开展作业。

好吧,我接受了

一个城市的居民讪笑另一个城市时会说,“那儿没有 ‘那儿’ 这个概念”。我曩昔也是这么看待数据管理的:很有意思的概念,可是托付 — 它有什么实践意义吗?Steve Adler 在关于数据管理的事务价值的争辩中说服了我。我现在以为数据管理是有价值的。

因而,假如信息管理范畴的大角色再到数据库 “轮机舱” 与您议论数据管理,那么好好听他们说。***考虑一下自己可以在哪些方面发挥作用。庞大的方案假如可以参阅实干家的定见,往往会获得更好的成果。

就到这儿吧。或许我会在咖啡机旁遇到您。谁知道呢?或许咱们会轻松地议论一下数据管理。

转载请说明出处
知优网 » 数据架构师: 您要管理什么?(什么是数据架构师)

发表评论

您需要后才能发表评论