为方便用户理解数据运营平台相关的重要概念,基本术语说明如下表所示。
|
术语 |
描述 |
|
工作空间 |
工作空间指用户进行数据集成、治理、开发等操作的空间。用户可以基于项目或工程维度,将统一项目或同一工程相关数据资源、开发作业等资源纳入统一工作空间统一管理和使用。 |
|
全局索引 |
全局索引会把HBase二级索引数据放置在HBase中 |
|
全文索引 |
全文索引会把HBase二级索引数据放置在Elasticsearch中 |
|
全文检索 |
利用Elasticsearch在数据搜索方面的高性能,提供多维度数据查询,并支持以图表形式呈现 |
|
数据表 |
数据源中的存储数据的表,是数据开发与治理的对象。数据表通常从数据源中采集识别或在本系统中创建,在表管理功能中统一管理 |
|
质量指标 |
将匹配数据的规则模型与数据表中的字段结合,生成的用于衡量数据质量的指标 |
|
作业 |
指作业管理模块下的作业。作业是按照系统调度规则生成的,包括可执行的代码程序包 |
|
实时作业 |
指作业管理模块下的实时作业。实时作业用于定义一个实时计算的完整流程,包括输入、输出、数据处理组件及其相关配置,作业开发完成后即可部署运行 |
|
数据同步作业 |
指作业管理模块下的数据同步作业,用于从Kafka中同步数据至指定的目标数据表中 |
|
业务流程 |
将不同作业进行组合生成一个针对业务的复杂任务执行流程,即可抽象成一个业务流程。一个业务流程包括多个作业,不同作业之间的顺序、依赖关系和触发条件等都可以在业务流程中配置 |
|
数据脱敏 |
指根据识别规则识别数据中的敏感信息,并通过脱敏策略进行处理,实现数据的脱敏化,保护数据安全 |