一键巡检

一键巡检主要从集群相关检查、节点资源相关检查和平台相关检查三方面对OCP集群进行巡检,用户可通过一键巡检的方式快速了解OCP集群各巡检项运行状态,及时发现集群存在的隐患,提高快速定位异常问题效率。

开始巡检

在巡检管理页面,单击<一键巡检>按钮,开始巡检任务,巡检完成生成一条巡检记录。巡检记录列表部分参数项说明如下:

删除巡检记录

巡检完成生成一条巡检记录,用户根据需求对巡检列表项进行删除。

  1. 在巡检管理页面,在巡检列表操作项单击<删除>按钮,弹出确认删除弹框。

  2. 单击<确认>按钮即可完成操作。

巡检概览

  1. 在巡检管理页面,在巡检列表操作项单击<查看详情>按钮,进行巡检详情页面。

  2. 在巡检详情页面,选择[概览]页签,可查看巡检结果的概览信息。

    • 巡检:当前登录用户权限下的所有集群总数,以及巡检通过的集群数。

    • 集群:当前登录用户权限下的所有集群的总数、运行中集群数、健康集群数、监控中集群数。

    • 节点:当前登录用户权限下的所有集群节点总数、在线状态节点总数。

查看巡检结果

  1. 在巡检管理页面,在巡检列表操作项单击<查看详情>按钮,进行巡检详情页面。

  2. 在巡检详情页面,选择[巡检结果]页签,可以查看集群巡检和平台巡检的列表信息。

    • 集群巡检结果:检查各集群的各类指标是否正常。单击<查看详情>按钮,可以查看详细的巡检项信息,包括类型、名称、描述、级别、检测是否通过、结果详情。

    • 平台巡检结果:检查服务状态、版本一致性等是否正常。

    集群巡检和平台巡检结果列表说明如下:

    • 巡检类型:其中集群巡检涉及的巡检类型为集群相关检查和节点资源检查,平台巡检涉及的巡检类型为平台相关检查,关于个巡检类型对应的巡检项如表-1所示。

    • 巡检级别:包括严重、重要、一般、提示四种级别。

    • 巡检是否通过:若各集群巡检项均通过则显示“通过”,否则为“不通过”;“人工检查”表示此集群运行状态不是运行中。

    表-1 集群和平台巡检项说明

    巡检类型

    巡检名

    巡检级别

    集群相关检查

    集群运行状态检查

    严重

    集群健康状态检查

    严重

    节点资源相关检查

    内存使用率检查

    重要

    CPU使用率检查

    重要

    磁盘使用率检查

    重要

    平台相关检查

    云数据库服务状态检查

    严重

    云数据库服务版本一致性检查

    一般

    云数据库服务版本一致性检查

    一般

导出巡检结果

以excel表格形式导出所有巡检结果,便于查阅巡检结果。

  1. 在巡检管理页面,在巡检列表操作项单击<查看详情>按钮,进行巡检详情页面。

  2. 在巡检详情页面,选择[巡检结果]页签,单击集群或平台巡检结果列表下<导出>按钮,可将巡检结果导出。