一键巡检主要从集群相关检查、节点资源相关检查和平台相关检查三方面对OCP集群进行巡检,用户可通过一键巡检的方式快速了解OCP集群各巡检项运行状态,及时发现集群存在的隐患,提高快速定位异常问题效率。
在巡检管理页面,单击<一键巡检>按钮,开始巡检任务,巡检完成生成一条巡检记录。巡检记录列表部分参数项说明如下:
软件人:执行一键巡检操作的用户。
巡检开始时间:每次巡检开始的时间。
巡检完成时间:每次巡检结束的时间。
巡检状态:巡检中、已停止(手动停止)、已完成(巡检任务结束)。
巡检完成生成一条巡检记录,用户根据需求对巡检列表项进行删除。
在巡检管理页面,在巡检列表操作项单击<删除>按钮,弹出确认删除弹框。
单击<确认>按钮即可完成操作。
在巡检管理页面,在巡检列表操作项单击<查看详情>按钮,进行巡检详情页面。
在巡检详情页面,选择[概览]页签,可查看巡检结果的概览信息。
巡检:当前登录用户权限下的所有集群总数,以及巡检通过的集群数。
集群:当前登录用户权限下的所有集群的总数、运行中集群数、健康集群数、监控中集群数。
节点:当前登录用户权限下的所有集群节点总数、在线状态节点总数。
在巡检管理页面,在巡检列表操作项单击<查看详情>按钮,进行巡检详情页面。
在巡检详情页面,选择[巡检结果]页签,可以查看集群巡检和平台巡检的列表信息。
集群巡检结果:检查各集群的各类指标是否正常。单击<查看详情>按钮,可以查看详细的巡检项信息,包括类型、名称、描述、级别、检测是否通过、结果详情。
平台巡检结果:检查服务状态、版本一致性等是否正常。
集群巡检和平台巡检结果列表说明如下:
巡检类型:其中集群巡检涉及的巡检类型为集群相关检查和节点资源检查,平台巡检涉及的巡检类型为平台相关检查,关于个巡检类型对应的巡检项如表-1所示。
巡检级别:包括严重、重要、一般、提示四种级别。
巡检是否通过:若各集群巡检项均通过则显示“通过”,否则为“不通过”;“人工检查”表示此集群运行状态不是运行中。
巡检类型 | 巡检名 | 巡检级别 |
集群相关检查 | 集群运行状态检查 | 严重 |
集群健康状态检查 | 严重 | |
节点资源相关检查 | 内存使用率检查 | 重要 |
CPU使用率检查 | 重要 | |
磁盘使用率检查 | 重要 | |
平台相关检查 | 云数据库服务状态检查 | 严重 |
云数据库服务版本一致性检查 | 一般 | |
云数据库服务版本一致性检查 | 一般 |
| 以excel表格形式导出所有巡检结果,便于查阅巡检结果。 |
在巡检管理页面,在巡检列表操作项单击<查看详情>按钮,进行巡检详情页面。
在巡检详情页面,选择[巡检结果]页签,单击集群或平台巡检结果列表下<导出>按钮,可将巡检结果导出。