半结构化文件采集入MPP

1.      场景说明

半结构化文件采集入MPP场景使用文件抽取组件,从半结构化(CSVXMLJSON等)文件中抽取数据,然后使用表加载组件将数据加载至MPP中,以下是任务的配置流程:

图-1 任务流程

 

2.      配置示例

文件抽取支持多种半结构化文件格式,不同的数据格式配置方式有所区别,下面以CSV文件抽取为例进行介绍:

  1. 单击半结构化文件采集入MPP场景卡片,弹出“新建作业”窗口,在新建作业窗口中配置作业名称,描述信息、标签等信息后,单击<确定>按钮进入任务配置页面。

图-2 新建作业

 

  1. 进入任务配置页面后,首先配置文件抽取组件参数信息:

图-3 文件抽取

 

  1. 双击表加载组件,配置表加载组件的基本信息参数:

图-4 表加载

 

  1. 所有组件配置完成后,单击<保存>按钮,完成任务配置信息。