基本概念

为方便用户理解数据运营平台相关的重要概念,基本术语说明如下表所示。

表-1 产品术语

术语

描述

工作空间

工作空间指用户进行数据集成、治理、开发等操作的空间。用户可以基于项目或工程维度,将统一项目或同一工程相关数据资源、开发作业等资源纳入统一工作空间统一管理和使用。

全局索引

全局索引会把HBase二级索引数据放置在HBase

全文索引

全文索引会把HBase二级索引数据放置在Elasticsearch

全文检索

利用Elasticsearch在数据搜索方面的高性能,提供多维度数据查询,并支持以图表形式呈现

数据表

数据源中的存储数据的表,是数据开发与治理的对象。数据表通常从数据源中采集识别或在本系统中创建,在表管理功能中统一管理

质量指标

将匹配数据的规则模型与数据表中的字段结合,生成的用于衡量数据质量的指标

作业

指作业管理模块下的作业。作业是按照系统调度规则生成的,包括可执行的代码程序包

实时作业

指作业管理模块下的实时作业。实时作业用于定义一个实时计算的完整流程,包括输入、输出、数据处理组件及其相关配置,作业开发完成后即可部署运行

数据同步作业

指作业管理模块下的数据同步作业,用于从Kafka中同步数据至指定的目标数据表中

业务流程

将不同作业进行组合生成一个针对业务的复杂任务执行流程,即可抽象成一个业务流程。一个业务流程包括多个作业,不同作业之间的顺序、依赖关系和触发条件等都可以在业务流程中配置

数据脱敏

指根据识别规则识别数据中的敏感信息,并通过脱敏策略进行处理,实现数据的脱敏化,保护数据安全