· 用户如果配置了通知策略(邮件通知或企业微信),需在[系统/系统配置/基础配置/消息设置]中配置相关服务连接后,通知策略才能生效。 · 绿洲平台部署时如果配置了域名部署,会导致DE环境无法识别绿洲的域名。CDC任务提交yarn时,用户需手动同步绿洲平台的IP和域名的映射关系,具体操作参见CDC任务提交yarn时手动在DE集群中同步绿洲平台IP和域名的映射关系。如果部署时没有配置域名部署,则无需进行该操作。 |
作业配置完成后,可单击<运行>按钮立刻运行作业,作业只有在上线之后才能运行。
在数据集成模块下选择[作业管理/作业定义],进入作业定义页面。
在页面顶部导航栏选择工作空间,页面显示对应工作空间下的作业目录。
鼠标右键单击作业目录中作业名称,在弹出列表中选择运行,弹出作业运行设置窗口:
失败策略:配置该作业的失败策略,当选择“继续”时,作业运行失败时,会跳过失败节点继续向下运行;当选择“结束”时,作业运行失败时,会立即结束运行。
流程优先级:该作业调度的优先级,当调度器接收到作业时,优先级高的会优先调度。
通知策略:作业运行结束时的通知策略,可选失败时通知、成功时通知、超时通知,也可不选择,表示不通知。其中超时通知生效的前提是需要在作业里开启超时告警然后配置超时时间。
通知人:当通知策略选择了通知时,需配置该项。作业运行结束时需要通知的用户,用户可在下拉框中进行选择。
通知类型:当通知策略选择了通知时,需配置该项。以何种方式通知用户,支持邮件和企业微信方式。
设置启动参数:如果新建作业时配置了全局变量,启动参数列表中会展示用户创建的全局变量。用户可根据业务需要对启动参数进行新增、修改或删除。在启动新的作业实例时,设置会覆盖全局变量的值。
提交方式:仅运行CDC作业时会显示该配置项。提交方式可选local或yarn。
local:作业提交到本地Flink独立集群。
yarn:通过yarn提交至DataEngine中的Flink集群。其中Flink集群的TaskManager数量=向上取整(作业并行度/TM槽位数量)。例如作业并行度为5,TM槽位数为4,则启动的TaskManager数量为2。
运行内存:配置yarn为该作业启动的Flink集群中单个TaskManager的运行内存。
租户:配置yarn的租户,将使用该租户对应的资源队列,将任务提交至yarn。
TM槽位数量:配置yarn为该作业启动的Flink集群的单个TaskManager的槽位数。
yarn vcores:配置yarn进行该作业启动时,CPU核心的使用份额。
checkpoint超时时间:Flink集群可容忍的checkpoint超时时间,超过该时间,作业运行终止。
checkpoint容忍失败次数:Flink集群可容忍的checkpoint失败次数,超过该次数,作业运行终止。
checkpoint周期:配置Checkpoint周期,会按配置的周期去保存Checkpoint状态。
清除断点:当运行实时作业时,页面会展示<清除断点>按钮。当用户需要重新抽取数据时,单击<清除断点>后,下一次运行从实时作业内“抽取方式”指定的配置开始向后抽取;如果不单击<清除断点>,默认断点续传。