​数据谱系

元数据 数据谱系
元数据 浏览量:157 发布时间:2024-12-26

数据谱系

我们之前的话题中提到了三个术语,即主数据管理、元数据管理和数据谱系。主数据和元数据管理已经涵盖了。现在是时候解码数据谱系了,这是防止数据湖变成数据沼泽的最重要因素。没有元数据的支持,就无法建立高效的数据谱系。

 

我不会详细介绍数据沼泽,这是一个单独的话题。但是,如果BI解决方案中显示任何数据,而无法将其追溯到其来源,这意味着没有数据谱系,并且正在走向灾难,因为即使现在不是,但将来将不知道数据来自哪里以及它被用在哪里。

数据谱系是标记所有触点(例如数据库、表、列、业务角色等)的过程,从中可以了解数据从何处传输到BI解决方案或下游系统,同时还显示了它经过的所有ETL、所有数据增强、转换、转、聚合以及沿途创建的所有新度量。这有助于企业信任数据的完整性和准确性,以支持其决策。数据谱系提供企业数据生命周期的审计跟踪,并帮助用户了解用户访问度量(UAM)。

建立适当的数据谱系过程可以减少80%的解决错误所需的工作量,同时在执行任何错误或现有解决方案所需的影响分析时消除人为错误因素。它极大地有助于在GUI模式下找到错误的根本原因,并在解决方案中提供帮助,最小化错过任何元素的可能性。

 

简而言之,数据谱系帮助BAU(Business As Usual业务运营正常)支持团队找出研发过程中从源头到终点的数据追踪。

数据谱系是数据溯源的低级细节。


扫码联系
电话联系