查看血缘关系的步骤如下:
在血缘管理页面中,选择“血缘关系”页签。
在页签的搜索区域中,选择特定的表、作业、数据API或应用。
搜索类型:在下拉框中选择待查看血缘关系的对象类型,包括“表”、“作业”、“数据API”和“应用名称”。当选择“表”时,后方的参数为“表名”。当选择“作业”时,后方的参数为“作业名”。当选择“数据API”时,后方参数为“api”。当选择“应用名称”时,后方参数为“app”。
表名:在下拉框中选择数据源,并选择要查看的表。
部分数据表所属的数据源名称显示“__hive_source__”,较为特殊。特殊数据源名称说明: · 业务流程-HiveSQL节点任务所使用的Hive数据源是系统所使用大数据集群中的Hive组件资源,非数据源管理模块中的Hive数据源,因此使用“__hive_source__”将此数据源特别标识。 · 业务流程-SparkSQL节点任务中使用的表可以是系统所使用大数据集群的Hive组件中的数据表,因此同样使用“__hive_source__”将数据表所属的数据源特别标识。 |
作业名:在下拉框中选择作业类型,并选择要查看的作业。有多种作业类型可选择,分别是:DI任务、实时作业、业务流程-SparkSQL节点任务、业务流程-RDSSQL节点任务、业务流程-HiveSQL节点任务、同步作业和全文检索。
api:在下拉框中选择要查看血缘信息的数据API。
app:在下拉框中选择要查看血缘信息的应用。
当搜索类型为“表”时,可以配置血缘展示的类型,包括全链路分析、溯源和影响分析,还可以设置血缘的展示层数,层数分为上游层数和下游层数,可分别设置。
全链路分析:查看表的来源与去向。
溯源:查看表的来源。
影响分析:查看表的去向。
上游层数:表来源的层级数,例如输入1表示展示该表的上一个来源表,输入2表示展示该表的上一个来源表,以及上上个来源表。
下游层数:表去向的层级数,例如输入1表示展示该表的下一个目标表,输入2表示展示该表的下一个目标表,以及下下个目标表。
在展示区域的左侧,提供了如下操作:
表节点信息
对于查询出的血缘关系图,点击某个表头右侧的图标,页面右侧会弹出节点信息栏,展示该表的节点信息和所属作业的信息。
节点信息包括:节点名称、节点类型、中文名称、描述信息、数据源、库名/模式名和字段总数。
所属作业的信息包括:作业名、ID、类型、创建时间、创建人和描述。如果当前表属于多个作业,则会有多个所属作业信息。创建时间、创建人和描述只有在有数据时才会展示。
字段节点信息
在血缘管理的展示区域中,当表已展开时,点击字段右侧的图标,页面右侧会弹出节点信息栏,展示字段的节点信息。字段的节点信息包括:节点类型、节点名称、中文名称、描述信息、字段类型和字段类别。