“全部”目录下不可新建数据同步作业。 |
在作业管理页面“数据同步”页签中,执行下述操作之一,弹出新建作业窗口:
在目录中选择某目录后,在右侧区域中,单击列表上方的<新建>按钮。
在窗口中,配置作业参数,包括:
作业名称:输入作业名称。
输入数据源:选择Kafka类型数据源。
输入表:选择输入数据源下的Kafka输入表。关于Kafka输入表说明如下:
如果输入表是BLOB类型,无需设置输出源类型,默认是File类型任务。
如果输入表是CSV/JSON/Message类型,需要配置输出源类型。
输出源类型:配置输出数据源的类型,配置不同的输出源类型,后续的初始化动作不同。
单击<确定>按钮,新建数据同步作业完成。
数据同步作业完成后,还需要根据情况对作业进行初始化,详细操作请参见初始化数据同步作业。 |
数据同步作业需要在创建完成后执行初始化作业操作。
在页面右侧的列表中,单击待初始化作业对应操作列中的<详情>按钮,进入数据同步作业页签。
在页签的操作提示区域中,单击“初始化作业”链接,即可完成对作业的初始化。
初始化完成后,还需继续配置作业参数。
表-1 数据源表组件配置参数介绍
配置 |
说明 |
同步任务配置 |
该区域涉及配置如下参数:
|
字段映射配置 |
该区域用于配置映射和函数。
|
使用日期函数的一些常用时间格式,如:"yyyy-MM-dd HH:mm:ss.SSS"、"yyyy/MM/dd HH:mm:ss.SSS"、"MM/dd/yyyy HH:mm:ss.SSS"、"yyyy-MM-dd HH:mm:ss"、"yyyy/MM/dd HH:mm:ss"、"MM/dd/yyyy HH:mm:ss"、"yyyy-MM-dd HH:mm"、"yyyy/MM/dd HH:mm"、"MM/dd/yyyy HH:mm"、"yyyy-MM-dd HH"、"yyyy/MM/dd HH","MM/dd/yyyy HH"、"yyyy-MM-dd"、"yyyy/MM/dd"、"MM/dd/yyyy"、"yyyyMMdd"、"yyyy-MM-dd:HH-mm-ss.SSS"。 对于日志类型任务,在以MySQL数据库为目的端时,如果遇到float等浮点型类型的数据,由于MySQL数据库本身的问题,会存在精度丢失问题,建议使用decimal高精度的浮点数据类型。 如果需要使用float类型,可能会导致在转换update和delete类型的日志数据时不生效。针对该问题,可以通过如下方法解决: · 数据来源中所有该float浮点型数据的精度保持一致。 · 将MySQL数据库中float类型的精度设置为与实际数据使用的浮点精度一致。 |
单击<确定>按钮,数据同步作业初始化完成。
在作业管理页面“数据同步”页签中,选择待查看作业所属的目录,并在右侧列表中,单击作业对应操作列中的<详情>按钮,进入该同步作业页签。
在同步作业页签中,单击<编辑>按钮。
参考初始化数据同步作业对数据同步任务进行编辑,其中:
作业名称、目的数据源、目的表名不支持修改。
字段映射配置中映射类型固定同行映射,用户只能在以前的映射关系基础上进行重新编辑;可以通过修改、关闭启用按钮,删除字段映射、开启启用按钮新增字段映射。
单击<确定>按钮,更新同步任务。
任务类型有限制,如果任务类型是FILE,则没有<编辑>按钮。 |
在作业管理页面“数据同步”页签中,选择待查看作业所属的目录,并在右侧列表中,单击作业对应操作列中的<详情>按钮,进入该同步作业页签。
窗口中各参数的说明请参见新建数据同步作业。
仅未在运行状态,且未被业务使用的数据同步作业可以被删除。 删除同步作业操作不可逆,一旦执行,则为该作业所做的参数配置数据都将被清除。如果该作业还存在血缘关系等,这些资源数据也将同时被删除,影响数据血缘关系的构建。删除操作风险较高,请谨慎执行。操作前请确认同步作业已不再需要,且无业务流程需要使用该作业,待充分确认后再删除。 |
在作业管理页面“数据同步”页签中,选择待查看作业所属的目录,并在右侧列表中,单击作业对应操作列中的<删除>按钮,弹出删除确认对话框。
单击<确定>按钮,数据同步作业删除完成。
在作业管理页面“数据同步”页签中,选择待查看作业所属的目录,并在右侧列表中,单击作业对应操作列中的<共享>按钮,即可将该作业共享给其他用户。作业被共享以后,其他用户即可对该作业进行编辑。
共享后,[共享]菜单项变为[取消共享]菜单项。选择[取消共享]菜单项,可以取消共享该数据同步作业。
· 仅作业的创建者可以共享该作业。 · 作业被共享以后,其他用户即可对该作业进行编辑。 |
作业管理提供了作业导出功能,支持导出部分同步作业和全部同步作业。
· 仅每个组织的组织管理员可以导出所属组织的作业。 · 未进行初始化的同步作业不支持导出。 |
在作业管理“同步”页签中,选择待导出作业所在的目录,右侧列表展示了该目录下的所有作业。
在列表中,勾选待导出的部分作业,然后点击作业列表上方的<导出>按钮,即可导出部分作业。
执行导出操作后,系统会提示导出“导出任务提交成功”,单击页面右上角的<导出记录>按钮,弹出导出记录窗口,窗口中展示了导出记录列表。
在列表中,单击导出记录对应操作列的<下载>按钮,即可获得导出的同步作业文件。
在作业管理页面中,选择“同步”页签。
单击页面右上角的<全部导出>按钮,即可导出当前系统所有的同步作业。
执行全部导出操作后,系统会提示导出“导出任务提交成功”,单击页面右上角的<导出记录>按钮,弹出导出记录窗口,窗口中展示了导出记录列表。
在列表中,单击导出记录对应操作列的<下载>按钮,即可获得导出的同步作业文件。
作业管理提供了作业导入功能。
· 组织中的用户,在执行导入操作时,请务必确认仅有该用户在执行导入操作。多人同时操作,会导致更新的作业内容被其他用户的操作覆盖,出现部分用户查看到导入更新的作业内容不一致的情况。 · 各组织中的所有用户均可执行导入操作。 |
在作业管理页面中,选择“同步”页签。
单击页面右上角的<导入>按钮,弹出导入窗口。
在导入弹窗中,单击<上传文件>按钮,选择上传的文件。只支持上传xls格式的文件。
文件上传成功后,系统会自动解析上传文件中的内容,检测待导入作业与系统中已存在的作业重名情况,并在列表中对能否更新进行了说明,请用户参考说明内容确认无误后,选择操作。
单击<确定>按钮,系统即开始执行导入操作。
在“导入记录”页签中可以查看导入任务执行情况。对于执行失败的记录,请单击操作列中的<下载>按钮,下载导入结果文件,文件中会对导入失败原因进行说明,请按照提示对导入文件进行修改。
在作业管理页面中,单击页面右上角的<导出记录>按钮,弹出导出记录窗口。
窗口中以列表的形式展示了导出操作记录,表中包含了导出操作的记录名称、操作创建者、操作的状态、操作提交时间和结束时间,并提供了导出作业的下载功能。
在初始化数据同步作业或编辑数据同步作业完成后,单击<确定>按钮执行保存操作,系统会自动生成对应的数据血缘关系,可通过[数据资产/血缘管理]查看血缘关系。
· Kafka数据源的message类型的表不支持生成血缘关系。 · 输出数据源类型为File类型的作业,不支持生成血缘关系。 |