实时作业监控

实时计算作业运维提供对实时计算作业的启动、停止、暂停、恢复、监控(包含告警)等功能,帮助用户对实时计算作业的运行等进行管控。

YARN_SESSION部署模式的实时作业无监控。

 

查看实时作业列表

实时作业页面通过列表的形式展示了实时作业的信息,并提供了相关的维护操作链接。列表各列的介绍如下:

搜索实时作业

在实时作业列表左上方的搜索区域中,可以根据作业状态和作业名称两种条件搜索实时作业。两个条件无关联关系,可仅使用其中一个条件进行搜索。

  1. 在列表左上方的作业状态下拉菜单中选择作业的状态。

  1. 在作业名称输入框中输入名称关键字。

  1. 点击后方的图标,可以筛选出符合条件的实时作业。点击后方的图标,可以清除搜索。

启动实时作业

对于READYSUBMIT_FAILEDFINISHEDFAILED状态的实时作业,支持执行启动操作。

  1. 在实时作业列表中,单击待启动作业对应操作列中的“启动”链接,弹出确认对话框。

  1. 单击<确定>按钮,作业启动完成。

暂停实时作业

对于RUNNING状态的实时作业,可以执行暂停操作。

  1. 在实时作业列表中,单击待暂停作业对应操作列中的“暂停”链接,弹出确认对话框。

  1. 单击<确定>按钮,然后即可等待作业暂停操作完成。

停止实时作业

对于RUNNING状态的实时作业,可以执行停止操作。

  1. 在实时作业列表中,单击待停止作业对应操作列中的“停止”链接,弹出确认对话框。

  1. 单击<确定>按钮,然后即可等待作业停止操作完成。

恢复实时作业

对于已暂停的实时作业,可以执行恢复操作。

  1. 在实时作业列表中,单击待恢复作业对应操作列中的“恢复”链接,弹出确认对话框。

  1. 单击<确定>按钮,作业即开始进行恢复操作。

·          只有暂停过的作业才可以恢复;

·          页面会根据是否暂停过作业对作业进行区分,只有暂停过的作业,<恢复>按钮才可以点击。

 

监控实时作业

对于RUNNING状态的实时作业,可以执行监控操作。

在实时作业列表中,单击作业对应操作列中的“监控”链接, 进入实时作业监控页面。

实时作业监控页面展示了运行中的实时作业的监控信息。页面由作业流程图、告警和各监控指标三部分构成,各监控指标包括:作业健康状态、数据源发送和接收数据、网络传输、内存&CPU

启用告警规则的顺序请按照如下步骤:

1. 告警规则列表中,选取告警规则后,点击下方的<更新>按钮,首先更新作业的告警规则。

2. 然后点击启用告警规则。

 

查看异常

对于运行异常(SUBMIT_FAILED提交失败和FAILED运行失败)的实时作业,可以执行异常查看操作。

在实时作业列表中,单击作业对应操作列中的“异常”链接,弹出失败原因窗口。