集群监控模块用于展示Elasticsearch集群、索引、全文检索服务和全文检索接口监控数据。
数据展示形式有三种:卡片、表格和图表。卡片和表格展示的数据是某一时间段的终点时刻的数据;图表展示的是某一时间段内的数据。
在页面右上角可以选择时间段,可以选择时间起点和终点。卡片和表格中的数据展示的是时间段终点时刻的数据。图表展示的是该时间段内的数据,在图表中根据时间段的长短将展示不同个数的数据,最少12个数据,最多100个数据,然后使用折线将数据点连接起来。
进入集群监控页面的步骤如下:
在顶部导航栏中选择[数据运营/数据资产],进入数据资产页面。
单击左侧导航树中的[数据搜索/ES搜索管理]菜单项,进入ES搜索管理页面。
单击页面右上角的<集群监控>按钮,进入集群监控页面。
概览监控主要监控ES集群节点的整体繁忙程度及集群响应速度,及其指标信息。
页签顶部信息依次展示了集群的文档数量、索引数量、数据量(数据空间大小)、节点数量、未分配分片、堆内存、版本、全部分片及健康状态。集群健康状态包括red、yellow、green三种,分别是存在主分片未分配、存在副本分片未分配、所有分片全部分配。
时间框的范围表示用户查看监控的时间范围,可以点开选择具体的时间段,也可以选择近十五分钟、近一小时、近一天、近一周。
在每秒执行搜索的请求数.包含所有主副本分片,一次客户端搜索往往对应多个分片请求。
每个搜索平均等待时间,即执行搜索所需的时间除以提交的搜索数量。
每秒索引的文档数量.包含主分片与副本分片。
每个文档索引的平均延迟时间,即索引文档所花费的时间除以被索引的数量。
在集群监控页面单击“节点”标签,进入节点监控页面。
节点监控主要监控ES集群节点的指标信息。
页签顶部信息依次展示了集群的文档数量、索引数量、数据量(数据空间大小)、节点数量、未分配分片、堆内存、版本、全部分片及健康状态。集群监控状态包括red、yellow、green三种,分别是存在主分片未分配、存在副本分片未分配、所有分片全部分配。
列表信息依次展示了名称、状态、CPU使用率、负载、JVM内存、磁盘剩余空间、分片数量、采样时间。列表中的上下箭头表示相对于前十秒的状态,朝上意味着比前十秒大,反之相反。
单击节点列表中的名称链接,可跳转到节点详情页面。
节点详情页面顶部依次展示了该节点的文档数量、数据量(文档存储大小)、全部分片、节点类型、空闲磁盘空间、堆内存、索引数量、IP地址及状态。
系统负载:系统一分钟内的平均负载。
java虚拟机堆内存:运行Elasticsearch的Java虚拟机最大堆内存值和已用于Elasticsearch的堆内存值。
索引内存:当前所有索引和Terms分别使用的堆内存大小。
Segment数量:该节点中的分片文件数量。
执行延迟(ms):搜索表示该节点每个搜索平均等待时间,即执行搜索所需的时间除以提交的搜索数量;索引表示该节点每个文档索引的平均延迟时间,即索引文档所花费的时间除以被索引的数量。
CPU利用率(%):操作系统CPU利用率。
在集群监控页面单击“索引”标签,进入索引监控页面。
索引监控主要用于监控ES集群中索引的指标信息。
在索引概览页面中,以卡片形式展示集群监控指标数据,以列表形式展示各个索引监控数据。
集群监控指标包含:文档数量、索引数量、数据量、节点数量、未分配分片、堆内存、版本、全部分片和健康状态。
索引监控指标包含:索引名称、状态、健康、文档数量、数据量、索引速率、查询速率和未分配分片。
在索引概览页面的索引列表中,单击某个索引名,将进入该索引的详情页面。
索引详情页面使用卡片和图表两种形式展示监控指标数据。
卡片形式展示的监控指标:索引文档数量、数据量、全部分片和未分配分片。
图表形式展示的监控指标:索引内存、索引大小、Segement数量、文档数量、搜索率和索引率。
图表形式展示的索引监控指标解释:
索引内存:包含总堆内存、terms内存、points内存。
总堆内存:索引的总堆内存。
terms内存:词项使用的堆内存(例如文本)。
points内存:数字,IP和地理数据所使用的堆内存。
索引大小:索引(包含主副本分片)所占的磁盘空间。
Segement数量:索引的Segement数量。
文档数量:索引主分片的文档数量。
搜索率:索引全部分片每秒的搜索次数之和。
索引率:索引每秒的索引次数,包含主分片和全部分片的索引率。
在索引概览页面的列表中,单击待预览索引对应列表中的<预览>按钮,可以进入索引的预览页面,查看对应的索引数据,最多支持预览索引的500条数据。
索引预览页面中,以列表的形式展示了索引的信息,
在表头中点击字段后的图标,可调整索引列表的排序,。点击向上箭头,就按照该字段升序展示数据;点击向下箭头,就按照降序展示数据。
在集群监控页面单击“服务”标签,进入服务监控页面。
服务监控主要监控Snake实例的一些指标信息。
在集群监控页面点击“服务”标签进入服务概览页面。
在服务监控概览页面以列表形式展示各个全文检索服务的部分监控指标。监控指标包含:地址、状态、负载、cpu使用率、内存使用率、磁盘使用率、jvm堆内存使用率和采样时间。
在服务概览页面单击服务的地址将进入该服务的详情页面。
服务详情页面使用卡片和图表两种形式展示数据。
卡片形式展示的指标数据:服务名、启动时间、线程数量、系统内存、已用系统内存、内存使用率、堆内存、已用堆内存、非堆内存、已用非堆内存、磁盘空间、已用磁盘空间。
图表展示的指标数据:系统负载、cpu使用率、磁盘使用率、堆内存使用率、服务占用的cpu时间、gc次数和gc平均耗时。
图表展示的服务监控指标解释:
系统负载:系统在1分钟之内的平均负载。
cpu使用率:包含系统cpu使用率和服务进程cpu使用率。
磁盘使用率:磁盘空间使用率。
堆内存使用率:服务进程的jvm堆内存使用率。
服务占用的cpu时间:服务进程在10秒内所占用的cpu时间。
gc次数:服务进程在10秒内的gc次数,包含老年代和年轻代两种gc次数。
gc平均耗时:服务进程在10秒内的平均gc耗时,包含老年代和年轻代两种gc平均耗时。
在集群监控页面单击“接口”标签,进入接口监控页面。
接口监控主要监控Snake实例接口的一些指标信息。
在集群监控页面单击“接口”标签页进入接口监控概览页面。
在接口概览页面中以列表形式展示各个接口的监控指标。监控指标包含:接口名、调用次数、总耗时、平均耗时、最大耗时和最小耗时。
在接口概览页面,点击某一接口名将进入该接口的详情页面。
接口详情页面以图表形式展示接口的监控指标。监控指标包含:调用次数、总耗时、平均耗时、最大耗时和最小耗时。
接口监控指标解释:
调用次数:某一时间段内的调用次数。
总耗时:某一时间段内接口调用耗时之和。
平均耗时:某一时间段内接口调用耗时的平均数。
最大耗时:某一时间段内接口调用的最大耗时。
最小耗时:某一时间段内接口调用的最小耗时。