新建实时计算作业

  1. 在作业管理页面“实时”页签中,将鼠标悬于某目录名称后的图标上,并在弹出菜单中选择[新建作业]菜单项,弹出新建作业窗口。

  1. 配置作业参数,参数说明请参见下表。

表-1 实时作业参数说明

参数

说明

名称

配置符合命名规则的作业名称

类型

作业类型分为FLINK_SQLFLINK_JAR两种:

  • FLINK_SQL:提供作业画布设计实时计算作业。用户在作业画布上拖拽组件、连接组件、配置组件参数、编写SQL即可完成一个实时计算作业

  • FLINK_JAR:可将用户编写的Flink程序依托实时计算服务进行作业管理和运行。在创建FLINK_JAR作业前不需要提前注册流表,自定义作业的输入和输出可以由用户编写的程序决定

检查点

FLINK_SQL类型实时作业需要配置该项。选择是否开启检查点,开启检查点可以周期性地保存作业运行状态。当作业出现异常时可以从检查点恢复作业

如需开启,还需设置时间间隔和数据处理模式:

  • 间隔:设置周期的时间间隔,单位为毫秒(ms

  • 模式:配置处理模式,EXACTLY_ONCE表示数据仅会被处理一次;AT_LEAST_ONCE表示数据至少会被处理一次

文件

FLINK_JAR类型实时作业需要配置该项。单击<文件上传>按钮,选择Flink作业程序的Jar

主类名

FLINK_JAR类型实时作业需要配置该项。输入作业的主类名

参数

FLINK_JAR类型实时作业需要配置该项。指定作业的参数

部署模式

选择Flink作业的部署模式,包含两种模式:

  • YARN_SESSION:共享集群模式,作业都会提交到预先启动的Flink集群中,多个作业共用一个Flink集群管理节点。适合规模较小、执行时间较短的作业

  • YARN_PER:独立集群模式,使用该模式,每提交一个作业都会单独向YARN申请资源,直到作业执行完成。一个作业的失败与否不会影响下一个作业的正常提交和运行。即独享Flink集群管理节点,可按需申请资源。适合规模较大、执行时间较长的作业

配置

可根据需要配置作业的运行资源,包括管理节点内存、工作节点内存、资源队列

描述

作业描述,字数小于125

 

  1. 单击<确定>按钮,实时作业新建完成。

FLINK_SQL类型实时作业新建完成后,即可在画布中对作业进行可视化编辑。