NEW ETL一种新的抽取、转换、加载工具,将原ETL中的一些组件进行整合,在保证功能完全覆盖的基础上、提供更易用、更方便、更简洁的操作,并对于整合的组件进行功能的增强。
在数据集成模块下选择[作业管理/作业定义],进入作业定义页面。
在页面顶部导航栏选择工作空间,页面显示对应工作空间下的作业目录。
双击页面左侧目录树中的作业名称,会进入作业设计画布。
右键单击作业设计器画布,选择NEW ETL类型任务进行添加,会弹出任务信息配置窗口,用户需根据实际需要配置任务名称及描述信息,然后单击<确定>按钮会在画布中添加一个NEW ETL任务节点。双击任务节点,即可进入对应任务设计页面。
ETL任务设计页面说明:
NEW ETL组件:位于页面上方,包含文件抽件、函数、route及文件加载等组件。
根据需要,将NEW ETL组件拖拽到任务设计面板中,不同组件之间建立连接后可得到NEW ETL任务。两个组件间的连线方法有两种:a) 将鼠标放置在连线的起始组件上单击鼠标中键,拖拽连线至目标组件即可;b) 右键单击连线起始组件,选择建立连接选项,拖拽连线至目标组件单击鼠标左键即可。连接线颜色不同,代表不同的含义:
灰:配置连接线后,可单击该连接线将线置为“灰色”,灰色表示该线被禁用,不会生效。
蓝:蓝色表示连接线处于正常状态。当用户将连接线置为灰色后,可单击连接线将线置为蓝色。
双击画布中各组件图标,弹出配置窗口,根据实际情况进行参数配置。各组件配置的详细说明请参见对应的帮助信息。
NEW ETL任务设计器中的运行主要用于调试。在接入大量数据的情况下,不可使用页面化的方式运行任务,否则不仅效率低下且可能出现意外。
运行后,页面下方执行结果面板中会对应显示该NEW ETL任务的运行相关信息,包括步骤度量与执行输出日志两部分,可实时了解NEW ETL任务的执行情况。
任务设计面板上,右键单击某组件包含功能有:复制步骤、删除步骤、建立连接及查看结果等。
复制步骤:在页面上复制一个和该组件一样(除了名称不同,其他配置相同)的组件。
删除步骤:删除该步骤。
查看结果:查看该组件的输出数据,最多显示20条,显示结果展示在页面下方。
删除连线:任务面板上,右键单击某连线会弹出删除连接按钮,单击该按钮可删除两组件之间的连线。
调度配置:用户可对任务进行调度配置。调度配置功能位于画布右侧,单击<调度配置>按钮,弹出调度配置窗口。关于调度配置的具体参数说明可参见任务调度配置。
错误记录配置:用户可配置将作业运行错误记录保存在表或文件中。错误记录配置功能位于画布右侧,单击<错误记录配置>按钮,弹出错误记录配置窗口,关于错误记录配置的详细介绍可参见错误记录配置。