数据管道模块主要包括监控概览和数据采集功能。
数据管道模块可以构建数据流管道,提供系统或应用之间数据的可靠转换及接入功能。管道里的数据可用于实时分析、实时处理以及实时数据持久化等场景。例如,可以将数据持久化到HBase、FILE、STDB、Vertica、Elasticsearch、MySQL、PostgreSQL、GreenPlum、达梦等数据库中,便于后续的数据查询及分析。
数据管道提供多样的数据接入方式,在其它不同类型的数据源间进行数据流转、数据字段映射以及基本的数据转换。
数据管道功能包括如下功能:
数据管道的使用流程如下:
添加数据源
管道功能皆以Kafka类型数据源为基础,因此首先需要在数据源管理模块中添加实际可用的Kafka数据源。
创建管道
完成数据源添加之后,需要在对应数据源上创建管道,管道创建过程与其他类型数据源创建数据表过程一致。在本系统中,统一将数据存储介质抽象为表,因此需要在[数据开发/表管理]中创建对应管道。
结合具体使用,支持通过以下数据采集方式,将数据导入到管道中:
选择管道支持的数据采集方式,将数据导入到管道中,具体操作方式可见数据采集章节。
通过[数据开发/作业开发/作业管理]中的实时计算的作业,将数据接入管道中,具体操作可参见作业管理章节。