但数据质量的提升是一项复杂的工程。从数据的整个生命周期来看,任何一个环节都可能会产生数据质量问题,每个环节的数据质量都牵一发而动全身。所以,针对数据质量的管理通常难度较大。它不是单纯业务、技术或管理某单一维度的问题,它涉及到企业标准的制定、规范的落地、以及数据生命周期的管理等多个环节,应该是全组织必须协同遵守的基本规范。基于此,我们可以应用PDCA循环模型,来对数据质量来进行一个全面、长期的提升与管理。PDCA是一个万能的质量工具,是指按照Plan(规划设计)、Do(改进执行)、Check(监测评估)和Act(长效提升)的顺序进行质量管理,并且循环不止地进行下去的科学程序。
(2)成本效益原则
(2)业务规则数据体系是对业务规则的承载。确定了评估维度后,需结合具体业务情况,来对数据质量的评估体系进行更进一步的完善。数据模型设计应充分考虑业务场景中的关键业务规则,这些业务规则在后续的系统设计、实现中才能承接下来,否则就可能会导致遗漏关键业务信息,而与业务场景不符。3.对症下药:应该从哪些方面着手提升?得到了评估结果后,我们还需要找出影响数据质量的关键因素,对症下药。
企业的数据标准,可以在融合国家标准、行业标准和地方标准的基础上,融合组织自身的业务特色需求来制定。需要注意的是,标准并不是一成不变的,现今行业变化迅速,标准的制定者也需要紧跟变化与需求,不断完善企业数据标准。
a)严格执行数据标准必要时应用自动系统,保证数据的规范化、标准化录入,关键数据需进行复核或者审批。b)严禁数据造假行为有些人员可能会为了业务指标而提交造假的数据,使得数据的准确性无法保证。对于影响关键指标的数据造假行为,应采取零容忍态度。
a)明确需求数据质量即满足数据消费者需求的程度,数据消费者从使用视角提出数据质量要求,对于更好的数据质量参数的定义非常重要。
一份数据质量报告、一份评估检查结果并不是数据质量提高的终点。
我们在每个管理周期结束时,要认真梳理分析问题和不足,堵塞风险漏洞,提升数据质量,研究改进措施,提高管理效能。对于长期存在的问题,研究出台解决政策;对于反复出现的问题,通过修订制度加以约束;对于好经验要及时纳入长效机制;对于暂时无法解决的问题,应广泛征求建议,同时将新办法、新制度运用到下一个管理周期中。
—05—小结
数据质量不仅仅是数据治理的过程之一,它同时还是数据治理的目标之一。保证数据质量是数据要素流通的重要基础,也是企业实现数字化转型的关键前提之一。但数据质量管理不是一个单一过程,它涉及到多方参与、反复打磨。企业可以应用PDCA战略方法,来对数据质量进行一个系统的优化与提升,并将这个过程标准化、长期化、体系化,从源头、过程和结果层面,把控数据质量,从而更好地发挥数据价值。