数据治理工程化服务

        针对教育行业遍存在的“数据问题”,希嘉提供了基于数据中台建设的完整的数据治理解决方案(以下简称方案)。方案对高校内外的全量数据进行盘点、梳理、采集、整合、清洗和标准化,建立一个标准统一规范、来源权威稳定、数据高度融合、数据质量可靠的全量数据平台,实现对数据的全面采集、规范建模、质量提升、安全存储、可控共享和充分应用。


 

数据治理工程化服务流程

数据治理工程化服务


整个数据治理工作分为3个域,分别是:管理域、数据域和知识域。

●  管理域:进行数据架构的顶层设计、数据管理的规范和制度设计,主要是进行设计和咨询工作;

●  数据域:数据治理的核心内容,包含3个主要的工作流。

1、数据工作流:主要包含数据的识别、采集、集中、质量检查,成果数据生成入库,数据共享发布,直至被业务系统使用,生成新的数据,再次被采集,形成闭环。

2、标准工作流:从标准制定、分类建模并形成成果数据的元数据模型。

3、质量工作流:质量流是数据治理中工作量最大的部分,也是数据质量得到本质提升的过程。工作内容是对检查出来的质量问题进行修正、转换、纠错等操作。

●  知识域:治理过程中梳理出来的结构性、知识性信息。



数据治理工程化服务



希嘉数据治理主要活动

数据治理工程化服务


        主要包含3个阶段,即采集识别、清洗治理、成果生成和发布。具体包括设计校级数据标准,全量采集各种管理业务数据、电子表格数据、日志数据等,并对数据质量进行检核,针对质量问题进行清洗、转换、去重、补漏、纠错等操作,再按照标准模型和标准代码进行统一建模存储,形成战略级数据资产,并由大数据平台进行承载和运营发布。

        所有数据处理流程的各个环节都有标准化输出的要求,并在实施过程中有公司不同的部门岗位进行监控,确保能保质保量地按时完成。


数据治理工程化服务


数据治理概要步骤

数据治理工程化服务

数据治理工程化服务

摸清家底

通过部门业务和数据调研,进一步摸清家底,了解现状。

数据治理工程化服务

全量采集

更加广泛的收集数据,实现全量、全维度、全生命周期

数据治理工程化服务

标准制定

建设校级数据标准,使之符合学校的实际现状。

数据治理工程化服务

标准落地

将标准应用到数据上,应用到对业务系统的数据交换过程中。统一代码、统一字段名、明确权威来源。

数据治理工程化服务

积累、量化成果

通过数据治理工具,积累成果,保证延续性,步步为营,层层推进。

数据治理工程化服务

知识库建设

通过治理过程,形成数据资产目录、元数据库、数仓体系、数据质量规则库、数据质量报告、数据血缘关系、UC矩阵等。

数据治理工程化服务

制度形成与保障

通过规范和制度建设,理流程,规范行为,严格执行,确保治理成果能够不断更新迭代。


        希嘉利用完善的统一数仓管理系统、数据填报工具、日志处理工具、和统一数据开放平台,使整个治理过程可管、可控、可视化,降低了数据治理的技术难度,显著提升了工作效率。同时,通过提供管理咨询服务和顶层架构设计,形成数据标准体系、数据工具体系、数据管理知识库体系和数据管理流程制度体系,使数据资产成果能够长期持续继承、迭代和完善。

        基于治理后形成的全量、标准化、高质量的数据资产,利用数据统计、机器学习、人工智能等大数据相关技术,实现各种微观、中观、宏观尺度的统计、挖掘、分析、预测,为广大师生、各个业务部门、各级领导提供数据化、智能化的智慧校园服务。