质量报告中提供了针对数据源的质量评估报告,报告中提供了数据源的质量评级、接入率,并提供了表详情列表。
|
评估报告默认展示一个数据源的所有任务中最新一次的运行结果,可通过右上角选择方案执行时间,切换展示内容。 |
进入评估报告的步骤如下:
在顶部导航栏中选择[数据运营/数据质量],进入数据质量模块。
单击左侧导航树中的[评估报告]菜单项,进入评估报告页面。
在质量评估报告页面中,通过右上角选择评估方案和执行时间,可以查看不同评估方案各次评估的报告。页面下方的评估报告中,分别展示了:
报告概览
通过健康度评分和雷达图,展示了所选评估方案执行批次的整体信息。其中:
健康评分是按照雷达图中的五个维度评分计算得出,评分按不同的分数段进行划分,分数越高说明评估结果越好。
雷达图中各个维度的评分,则是根据评估项问题明细中各维度的具体情况得出。
接入信息
展示了评估方案中所包含数据源(可为多个)的连接配置信息。
业务信息探查明细
展示了数据源中各表的主键列信息,外键信息及关联关系,以及数据表关联的主题信息。
数据表探查明细
展示了数据表的多项信息:
区域右侧展示了数据标准覆盖率信息,即数据源中各表内字段与数据标准的关联比例。
数据规模明细展示了数据源中各数据表的数据规模详细信息,包括数据总条数、数据量、平均增量或存储量,以及更新周期信息。
代码字段明细展示了已关联数据标准中的数据项且数据项指定了代码的字段信息。
命名实体明细展示了字段中所存储数据的命名实体信息。数据命名实体是基于数据识别规则进行识别的。
数据倾斜明细展示了需进行数据倾斜扫描的各字段中数据是否倾斜。
评估项问题明细
展示了完整性、规范性、有效性、一致性、时效性五个维度中,按具体评估项对数据源得到的评估问题数据(存在问题数据的评估项,可以查看具体的问题信息),根据问题数据计算出各维度的评估得分。此外,还支持查看近一周、近一月、近三个月的健康分变化趋势。
|
对于时效性维度的表活跃度评估项,仅MySQL、DRDS、SQL Server和Oracle类型的数据源可以进行评估并计算实际得分,其他类型数据源无法评估默认为100分。 健康评分的计算逻辑如下: · 健康分总分=5个维度的得分之和÷5 · 单个维度得分=此维度下所有评估项的得分之和 · 单个评估项得分=100×(单个评估项权重÷单个维度评估项权重之和)×(1-单个评估项问题数÷单个评估项评估数据总数) |
系统提供了导出质量评估报告的功能。导出报告时,请尽量确保页面上部的数据源统计信息、质量评价和表活跃度信息可以完全展示。
在评估报告页签中,单击<导出质量评估报告>按钮,弹出导出窗口。
在窗口的“导出配置”页签中,选择评估方案和方案的执行时间。
单击<确定>按钮,自动跳转至“导出记录”页签。
当导出记录列表中,导出操作的状态为“完成”后,即可单击操作列的“下载”按钮,即可下载评估报告。
导出的质量评估报告中,展示的内容与质量评估报告页签一致,包括报告概览描述、接入信息、探查项明细、各评估项问题数量等信息。