数据治理包括哪些方面

2024-05-17

1. 数据治理包括哪些方面

从技术实施角度看,数据治理包含“理”“采”“存”“管”“用”这五个步骤,即业务和数据资源梳理、数据采集清洗、数据库设计和存储、数据管理、数据使用。
数据资源梳理:数据治理的第一个步骤是从业务的视角厘清组织的数据资源环境和数据资源清单,包含组织机构、业务事项、信息系统,以及以数据库、网页、文件和 API 接口形式存在的数据项资源,本步骤的输出物为分门别类的数据资源清单。
数据采集清洗:通过可视化的 ETL 工具(例如阿里的 DataX,Pentaho Data Integration)将数据从来源端经过抽取 (extract)、转换 (transform)、加载 (load) 至目的端的过程,目的是将散落和零乱的数据集中存储起来。
基础库主题库建设:一般情况下,可以将数据分为基础数据、业务主题数据和分析数据。基础数据一般指的是核心实体数据,或称主数据,例如智慧城市中的人口、法人、地理信息、信用、电子证照等数据。主题数据一般指的是某个业务主题数据,例如市场监督管理局的食品监管、质量监督检查、企业综合监管等数据。而分析数据指的是基于业务主题数据综合分析而得的分析结果数据,例如市场监督管理局的企业综合评价、产业区域分布、高危企业分布等。那么基础库和主题库的建设就是在对业务理解的基础上,基于易存储、易管理、易使用的原则抽像数据存储结构,说白了,就是基于一定的原则设计数据库表结构,然后再根据数据资源清单设计数据采集清洗流程,将整洁干净的数据存储到数据库或数据仓库中。

元数据管理:元数据管理是对基础库和主题库中的数据项属性的管理,同时,将数据项的业务含义与数据项进行了关联,便于业务人员也能够理解数据库中的数据字段含义,并且,元数据是后面提到的自动化数据共享、数据交换和商业智能(BI)的基础。需要注意的是,元数据管理一般是对基础库和主题库中(即核心数据资产)的数据项属性的管理,而数据资源清单是对各类数据来源的数据项的管理。
血缘追踪:数据被业务场景使用时,发现数据错误,数据治理团队需要快速定位数据来源,修复数据错误。那么数据治理团队需要知道业务团队的数据来自于哪个核心库,核心库的数据又来自于哪个数据源头。我们的实践是在元数据和数据资源清单之间建立关联关系,且业务团队使用的数据项由元数据组合配置而来,这样,就建立了数据使用场景与数据源头之间的血缘关系。 数据资源目录:数据资源目录一般应用于数据共享的场景,例如政府部门之间的数据共享,数据资源目录是基于业务场景和行业规范而创建,同时依托于元数据和基础库主题而实现自动化的数据申请和使用。
质量管理:数据价值的成功发掘必须依托于高质量的数据,唯有准确、完整、一致的数据才有使用价值。因此,需要从多维度来分析数据的质量,例如:偏移量、非空检查、值域检查、规范性检查、重复性检查、关联关系检查、离群值检查、波动检查等等。需要注意的是,优秀的数据质量模型的设计必须依赖于对业务的深刻理解,在技术上也推荐使用大数据相关技术来保障检测性能和降低对业务系统的性能影响,例如 Hadoop,MapReduce,HBase 等。
商业智能(BI):数据治理的目的是使用,对于一个大型的数据仓库来说,数据使用的场景和需求是多变的,那么可以使用 BI 类的产品快速获取需要的数据,并分析形成报表,像派可数据就属于专业的BI厂商。
数据共享交换:数据共享包括组织内部和组织之间的数据共享,共享方式也分为库表、文件和 API 接口三种共享方式,库表共享比较直接粗暴,文件共享方式通过 ETL 工具做一个反向的数据交换也就可以实现。我们比较推荐的是 API 接口共享方式,在这种方式下,能够让中心数据仓库保留数据所有权,把数据使用权通过 API 接口的形式进行了转移。API 接口共享可以使用 API 网关实现,常见的功能是自动化的接口生成、申请审核、限流、限并发、多用户隔离、调用统计、调用审计、黑白名单、调用监控、质量监控等等。

数据治理包括哪些方面

2. 什么是数据治理?

数据治理的确是一项艰巨的任务,需要耗费常人难以想象的时间和精力。但如果我们结合实际,将理论知识应用于已有的组织架构,难度可能就会低很多。
从全球数据科技发展现状来看,数据安全体系的落地相比数据治理更加成熟,大众接受度更高。而治理又能为数据安全的实际应用效果起到决定性的作用。
因此,我们可以采用数据安全的策略支持数据治理项目的开展,体现数据治理的商业价值和关键作用。
数据是所有组织中最具价值的资产。
数据安全则是一种保护数据保密性、完整性和可用性的策略,旨在防止或减少安全事件的影响,并将风险降低到可接受水平。
数据安全和数据治理都有一个共同的目标——保护数据。数据治理是安全的基础,确保正确的人拥有正确的访问权限。
这里我们通过一个“家”的比喻,帮助大家更好地区分“数据安全”与“数据治理”各自的重要意义。

确保我们的家不被歹徒闯入这一点非常重要。
我们一般会采取锁门、安装警报等措施进行预防。只有居住在家中的授权人员才能进入房屋。这是我们所说的“安全”。
但是,一个安全的家并不意味它就是一个和平幸福的家。在一个幸福的家里,每个家人都可以自由活动,使用家用电器,享受干净整洁的环境。这样的情形只有在角色分配恰当的时候才会发生,在这个共同的家里,每个人各司其职,井井有条。这就是数据治理。
治理所涉及的角色主要分为以下几类:
发起人:房屋所有人并承担管理家庭的责任。
议会:每个家庭内部机构的负责人,内部机构包括厨房、花园、财务等。这些负责人需要作出重要的决定。在家庭角色中,一般都指父母。
管理专员:他们一般是某领域内的专家,负责解决相关领域内的所有问题并遵循一套规则进行管理。例如园艺师、房屋清洁工等。
管理协调员:这是家庭中的关键人物,负责找到合适的管理员,清晰掌握家庭规则的任何变化并传达给其它家庭成员。一般来说,这个角色也是父母。
房屋的上锁和安保功能十分重要,但同样重要的是,在家庭内部应该有一套实现有效管理的机制。内容参考:杭州世平信息科技有限公司微信公众号

3. 什么是数据治理?

什么是数据治理?
数据治理是流程、角色、政策、标准和指标的集合,可确保有效和高效地使用信息,使组织能够实现其目标。它建立了流程和职责,以确保整个企业或组织中使用的数据的质量和安全性。数据治理定义了谁可以对什么数据、在什么情况下、使用什么方法采取什么行动。
精心设计的数据治理策略对于任何处理大数据的组织来说都是基础,它将解释业务如何从一致、通用的流程和职责中受益。业务驱动因素强调在数据治理策略中需要谨慎控制哪些数据以及从这项工作中获得的预期收益。此策略将成为数据治理框架的基础。
例如,如果数据治理策略的业务驱动因素是确保医疗保健相关数据的隐私,则需要在患者数据流经业务时对其进行安全管理。将定义保留要求(例如,谁更改了哪些信息以及何时更改的历史记录)以确保符合相关政府要求,例如GDPR。
数据治理可确保明确定义与数据相关的角色,并在整个企业内就责任和问责制达成一致。精心规划的数据治理框架涵盖战略、战术和运营角色和职责。
 
数据治理不是什么
数据治理经常与其他密切相关的术语和概念混淆,包括数据管理和主数据管理。
 
数据治理不是数据管理
数据管理是指对组织全数据生命周期需求的管理。数据治理是数据管理的核心组成部分,将其他九个学科联系在一起,例如数据质量、参考和主数据管理、数据安全、数据库操作、元数据管理和数据仓库。
 
数据治理不是主数据管理
 主数据管理 (MDM) 侧重于识别组织的关键实体,然后提高这些数据的质量。它确保拥有有关客户、供应商、服务提供者等关键实体的最完整和准确的可用信息。由于这些实体在整个组织中共享,因此主数据管理是将这些实体的碎片化视图整合到一个视图中——超越数据治理的纪律。
但是,没有适当的治理就没有成功的 MDM。例如,数据治理计划将定义主数据模型(客户、产品等的定义是什么),详细说明数据的保留策略,并定义数据创作、数据管理和访问的角色和职责.
 
数据治理不是数据管理
数据治理可确保为合适的人员分配合适的数据职责。数据管理是指为确保数据准确、可控且易于被相关方发现和处理的必要活动。数据治理主要是关于战略、角色、组织和政策,而数据管理则是关于执行和运营。
数据管理员负责数据资产,确保实际数据与数据治理计划一致,与其他数据资产相关联,并在数据质量、合规性或安全性方面受到控制。
 
数据治理的好处
有效的数据治理策略可为组织带来许多好处,包括:
对数据的共同理解——数据治理为数据提供了一致的视图和通用术语,同时各个业务部门保留了适当的灵活性。
提高数据质量——数据治理创建了一个确保数据准确性、完整性和一致性的计划。
数据地图——数据治理提供了一种高级能力来了解与关键实体相关的所有数据的位置,这对于就像GPS可以代表物理景观并帮助人们在未知景观中找到方向一样,数据治理使数据资产变得可用并且更容易与业务成果联系起来。
每个客户和其他业务实体的360 度视图——数据治理建立了一个框架,以便组织可以就关键业务实体的“单一版本真相”达成一致,并在实体和业务活动之间建立适当的一致性级别。
一致的合规性— 数据治理提供了一个平台来满足政府法规的要求,例如数据安全法、个人信息保护法欧盟通用数据保护条例 (GDPR)和行业要求,例如 PCI DSS(支付卡行业数据安全标准)。
改进数据管理——数据治理将人的维度带入高度自动化、数据驱动的世界。它建立了数据管理的行为准则和最佳实践,确保传统数据和技术领域(包括法律、安全和合规等领域)以外的问题和需求得到一致解决。

什么是数据治理?

4. 企业数据治理具有哪些优势?

1、更好的决议计划
经过对企业数据进行管理,能够进步企业数据的一致性以及准确性,然后供给企业数据的质量,关于企业来说,事务决议计划会更有信心。
2、进步生产力
进行数据管理后,当两个数据发送冲突时,企业职工就不需要再花费时刻来寻找究竟哪个才是正确的信息。
3、更简单的合规性和审计
运用主动审查和监控的东西操控企业的数据。
4、记载您的数据
数据管理能够便于经过元数据进行扩充,然后供给其数据的相关性、可访问性、可搜干脆、合规性。
5、正确的对数据管理
能够供给更有效的信息访问和可见性,对企业来说,能够实现更好的数据分析。
关于企业数据治理具有哪些优势,青藤小编就和您分享到这里了。如果你对大数据工程有浓厚的兴趣,希望这篇文章能够对你有所帮助。如果您还想了解更多数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

5. 数据治理的什么是数据治理

信息系统建设发展到一定阶段,数据资源将成为战略资产,而有效的数据治理才是数 据资产形成的必要条件。虽然以规范的方式来管理数据资产的理念已经被广泛接受和认可,但是光有理念是不够的,还需要组织架构、原则、过程和规则,以确保数据管理的各项职能得到正确的履行。以企业财务管理为例,会计负责管理企业的金融资产,遵守相关制度和规定,同时接受审计员的监督;审计员负责监管金融资产的管理活动。数据治理扮演的角色与审计员类似,其作用就是确保企业的数据资产得到正确有效的管理。由于切入视角和侧重点不同,业界给出的数据治理定义已经不下几十种,到目前为止还未形成一个统一标准的定义。ITSS WG1认为数据治理包含以下几方面内容(1)确保信息利益相关者的需要评估,以达成一致的企业目标,这些企业目标需要通过对信息资源的获取和管理实现;(2)确保有效助力业务的决策机制和方向;(3)确保绩效和合规进行监督。数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程。数据治理的全过程数据治理其实是一种体系,是一个关注于信息系统执行层面的体系,这一体系的目的是整合IT与业务部门的知识和意见,通过一个类似于监督委员会或项目小组的虚拟组织对企业的信息化建设进行全方位的监管,这一组织的基础是企业高层的授权和业务部门与IT部门的建设性合作。从范围来讲,数据治理涵盖了从前端事务处理系统、后端业务数据库到终端的数据分析,从源头到终端再回到源头形成一个闭环负反馈系统(控制理论中趋稳的系统)。从目的来讲,数据治理就是要对数据的获取、处理、使用进行监管(监管就是我们在执行层面对信息系统的负反馈),而监管的职能主要通过以下五个方面的执行力来保证——发现、监督、控制、沟通、整合

数据治理的什么是数据治理

6. 对企业来说,数据治理的优势有哪些?

提升数据质量:建立数据质量进行定义、监测、分析、整改和评估的闭环管理机制,逐步提升全行数据治理;
加强源头控制:从源头控制数据质量,参照数据标准,培训数据录入人员与客户经理熟悉相关的数据质量规范要求。把数据质量管理流程融入到业务管理流程中,通过流程去规范化数据操作;
统筹外部数据:明确外部数据管理工作,规范外部数据的采集、共享与应用流程,建立外部数据采购管理,数据资产的发布和维护等流程;
完善全行统一客户视图,建立统一产品信息管理:根据各类业务的信息归类,针对不同的主数据特点,统一业务概念,促进数据信息的整合,建设或完善相应的客户、产品、机构等主数据管理系统;
加大数据人才培养,智能工具应用:根据业务用数需求,配置并培养专业数据人员,加大数据可视化、商务智能工具应用,积极探索数据应用场景,以数据驱动内部管理和业务发展的持续提升;
数据分析挖掘:利用大数据实现信用风险管理,利用行内外大数据资源及人工智能技术,将打分卡、策略、决策引擎等量化分析工具应用于风险管理 领域,提升风险管理水平;
统一数据口径:在全行范围对基础数据标准和指标数据标准形成统一的认识,制定全行级的数据标准,明确指标及其相关基础数据项的名称、业务含义、加工口径、应用场景、责任部门及权威系统等信息。

7. 数据治理的价值体系包括哪些方面?

数据治理的价值体系包括:
· 对数据的共同理解——数据治理为数据提供了一致的视图和通用术语,同时各个业务部门保留了适当的灵活性。
· 提高数据质量——数据治理创建了一个确保数据准确性、完整性和一致性的计划。
· 数据地图——数据治理提供了一种高级能力,可以了解与关键实体相关的所有数据的位置,这是数据集成所必需的。就像 GPS 可以代表物理景观并帮助人们在未知景观中找到方向一样,数据治理使数据资产变得可用并且更容易与业务成果联系起来。
· 每个客户和其他业务实体的360 度视图——数据治理建立了一个框架,以便企业可以就关键业务实体的“单一版本真相”达成一致,并在实体和业务活动之间创建适当的一致性级别。
· 一致的合规性— 数据治理提供了一个平台来满足政府法规的要求,例如欧盟通用数据保护条例 (GDPR)、美国 HIPAA(健康保险流通与责任法案)和行业要求,例如 PCI DSS(支付卡行业数据安全标准)。
· 改进数据管理——数据治理将人的维度带入高度自动化、数据驱动的世界。它建立了数据管理的行为准则和最佳实践,确保传统数据和技术领域(包括法律、安全和合规等领域)以外的问题和需求得到一致解决。

数据治理的价值体系包括哪些方面?

8. 什么是数据治理?

从技术实施角度看,数据治理包含“理”“采”“存”“管”“用”这五个步骤,即业务和数据资源梳理、数据采集清洗、数据库设计和存储、数据管理、数据使用。
数据资源梳理:数据治理的第一个步骤是从业务的视角厘清组织的数据资源环境和数据资源清单,包含组织机构、业务事项、信息系统,以及以数据库、网页、文件和 API 接口形式存在的数据项资源,本步骤的输出物为分门别类的数据资源清单。
数据采集清洗:通过可视化的 ETL 工具将数据从来源端经过抽取 (extract)、转换 (transform)、加载 (load) 至目的端的过程,目的是将散落和零乱的数据集中存储起来。
基础库主题库建设:一般情况下,可以将数据分为基础数据、业务主题数据和分析数据。基础数据一般指的是核心实体数据,或称主数据,例如智慧城市中的人口、法人、地理信息、信用、电子证照等数据。主题数据一般指的是某个业务主题数据,例如市场监督管理局的食品监管、质量监督检查、企业综合监管等数据。而分析数据指的是基于业务主题数据综合分析而得的分析结果数据,例如市场监督管理局的企业综合评价、产业区域分布、高危企业分布等。那么基础库和主题库的建设就是在对业务理解的基础上,基于易存储、易管理、易使用的原则抽像数据存储结构,说白了,就是基于一定的原则设计数据库表结构,然后再根据数据资源清单设计数据采集清洗流程,将整洁干净的数据存储到数据库或数据仓库中。


元数据管理:元数据管理是对基础库和主题库中的数据项属性的管理,同时,将数据项的业务含义与数据项进行了关联,便于业务人员也能够理解数据库中的数据字段含义,并且,元数据是后面提到的自动化数据共享、数据交换和商业智能(BI)的基础。需要注意的是,元数据管理一般是对基础库和主题库中(即核心数据资产)的数据项属性的管理,而数据资源清单是对各类数据来源的数据项的管理。
血缘追踪:数据被业务场景使用时,发现数据错误,数据治理团队需要快速定位数据来源,修复数据错误。那么数据治理团队需要知道业务团队的数据来自于哪个核心库,核心库的数据又来自于哪个数据源头。我们的实践是在元数据和数据资源清单之间建立关联关系,且业务团队使用的数据项由元数据组合配置而来,这样,就建立了数据使用场景与数据源头之间的血缘关系。 数据资源目录:数据资源目录一般应用于数据共享的场景,例如政府部门之间的数据共享,数据资源目录是基于业务场景和行业规范而创建,同时依托于元数据和基础库主题而实现自动化的数据申请和使用。
质量管理:数据价值的成功发掘必须依托于高质量的数据,唯有准确、完整、一致的数据才有使用价值。因此,需要从多维度来分析数据的质量,例如:偏移量、非空检查、值域检查、规范性检查、重复性检查、关联关系检查、离群值检查、波动检查等等。需要注意的是,优秀的数据质量模型的设计必须依赖于对业务的深刻理解,在技术上也推荐使用大数据相关技术来保障检测性能和降低对业务系统的性能影响,例如 Hadoop,MapReduce,HBase 等。
商业智能(BI):数据治理的目的是使用,对于一个大型的数据仓库来说,数据使用的场景和需求是多变的,那么可以使用 BI 类的产品快速获取需要的数据,并分析形成报表,像派可数据就属于专业的BI厂商。
数据共享交换:数据共享包括组织内部和组织之间的数据共享,共享方式也分为库表、文件和 API 接口三种共享方式,库表共享比较直接粗暴,文件共享方式通过 ETL 工具做一个反向的数据交换也就可以实现。我们比较推荐的是 API 接口共享方式,在这种方式下,能够让中心数据仓库保留数据所有权,把数据使用权通过 API 接口的形式进行了转移。API 接口共享可以使用 API 网关实现,常见的功能是自动化的接口生成、申请审核、限流、限并发、多用户隔离、调用统计、调用审计、黑白名单、调用监控、质量监控等等。
最新文章
热门文章
推荐阅读