01-正文
本章节下载: 01-正文 (5.19 MB)
目 录
伴随着IT运维管理目标、管理范围、管理对象、管理深度的转变,IT运维平台建设呈现管理一体化、运维自动化、运维智能化、业务可视化及端到端敏捷化的关键趋势转变。H3C U-Center面向业务服务,融合基础架构资源的全面管理,以用户业务场景为导向提供灵活的自动化编排,同时满足客户IT服务管理及资源管理需求的综合运维管理平台解决方案。
U-Center作为新一代智能运维管理平台,具备以下五个特点:
· Unified:一体化
提供全域视角,提供面向混合异构的云-网-端IT基础设施统一管理功能;同时以业务视角,打通业务到底层资源的逻辑连接,数据关联、深度智能分析;并以全局视角,提供场景化自动编排调度,让IT自动交付。
· Universal:全行业全场景覆盖
深度分析行业运维需求、场景化需求,发布贴近行业客户深度运维需求的行业版本。
· User-Oriented:用户导向
U-Center系统设计核心理念就是要以用户视角,提供全新的用户体验;同时深度挖掘运维场景,以场景化视角提供便捷简单的操作方法。
· Unlimited:持续扩展
具备强大的可扩展能力,保证平台功能、处理能力及管理容量的弹性扩展。同时开放接口,支持系统融合。
· Unique:独一无二的专属平台
基于定制可视化平台,提供客户专享的综合运维平台,满足客户个性化管理需求和平台价值呈现。
H3C U-Center智能运维平台提供强大的融合基础架构运行监控管理(IOM)、自动化运维管理(AOM)、资源配置管理(CMDB)、业务服务管理(BSM)、IT服务管理(ITSM)、定制可视化中心(CVC)等主要管理功能。
在自动化运维领域,新华三凭借丰富的全IT基础构架技术服务经验积累,形成知识库、规范库和脚本库等,作为自动化运维平台的核心资产。核心能力集包括:网络自动化、服务器自动化、存储自动化、脚本管理自动化、应用交付自动化、自动化调度编排等功能。能够基于客户日常运维场景提供自动化的部署、智能排障、合规审计、灾备演练等,真正提升IT运维的效率和用户体验。
在IT服务管理领域,除了灵活支持传统的ITIL标准流程管理模块之外,还贴合国内用户的需求,增强了非标准流程的管理能力,比如项目管理、备品备件管理、综合服务质量管理等,真正助力客户逐步构建运维的核心生产系统。
系统网络管理架构如图1-1所示。
BSM以业务为管理对象,将IT服务与IT基础设施整合,对业务进行实时监控。通过容量管理、拓扑、告警等多角度评估业务的运行情况,直观展示IT基础设施变化对业务运行的影响。
BSM为管理员提供了简单、直观、动态的反映企业业务系统运行状况的可视化视图。通过可视化视图,管理员能够实时掌握各业务的运行状况,及时发现故障业务,快速准确定位故障节点,尽快恢复业务,确保为用户提供良好的业务服务。U-Center BSM模块如图2-1所示。
U-Center BSM模块包含如下功能:
· 业务数据窗
通过大屏视图实时展示企业业务系统的整体运行情况,并提供进入业务容量视图、业务资源拓扑、业务告警及业务基于时间轴的分析报表页面的入口。
¡ 容量视图:查看业务中所有主机的容量概况、容量风险预测以及容量负载信息。
¡ 业务资源拓扑:查看业务IT资源的拓扑结构,IT资源之间的关联关系以及其运行状况。
¡ 业务告警:查看业务的全部告警信息。
¡ 基于时间轴分析:查看业务历史数据,基于时间分析业务的健康度与繁忙度以及IT资源影响繁忙度的指标周期变化趋势。
· 用户体验管理
查看最终用户使用业务系统的真实体验。
· 业务概览
查看业务运行的简要信息,便于管理员快速掌握所有业务的运行情况。
· 业务监视
用于定义一个业务,即将IT服务与IT资源整合,以及对业务阈值和权重进行配置。
· 业务分组
将业务进行分组管理,以控制操作员对业务的管理权限,从而实现对业务的分权管理。
· 业务端到端拓扑
指定访问业务的源端到业务或服务主机之间的网络拓扑,以及源端到目的端各节点及链路的健康状况。
· 数据中心管理
用于定义一个数据中心,即将物理服务器、宿主机整合,实现对数据中心的容量管理。
· 数据中心鸟瞰图
查看数据中心的运行状态,以及与集群、宿主机、物理服务器和虚拟机的层级关系,并提供相应报告,掌握其容量概况。
· 巡检任务管理
用于定义一个巡检任务,即将多个应用统一进行检查,并提供在线或下载查看巡检报告的功能,集中掌握应用的运行状况。
· 巡检采集项
为巡检任务提供采集项。集中管理所有采集项,系统已为各应用默认提供一些常用采集项,用户也可以自定义采集项。
· 配置管理
用于配置BSM业务参数、业务维护计划,以及管理业务中基础设施的联系人。配置管理包括参数设置、联系人列表和维护计划。
¡ 参数配置:配置业务服务管理组件的数据保存时长,系统根据配置的保存时长定期清理超过时限的数据。
¡ 联系人列表:对业务中基础设施的联系人进行集中管理。
¡ 维护计划:针对企业对服务主机、业务应用及网络设备的日常维护制定的维护计划。维护计划内的服务主机、业务应用或网络设备各项指标将以最优值参与业务可用度、健康度及繁忙度得分计算。
BSM通过业务繁忙度、健康度、可用度得分评估业务的运行情况。下面详细介绍影响业务得分的因素和得分计算方法。
· 繁忙度
业务最新的繁忙度得分,基于业务内各服务主机/业务应用/网络设备的监控数据计算得出,表示业务运转的繁忙程度。
繁忙度得分计算的影响因素:
¡ 网络设备:参与计算的指标包括CPU利用率、内存利用率和接口输入/输出带宽利用率。
¡ 服务主机:参与计算的指标包括CPU利用率、物理内存利用率、虚拟/交换内存利用率和延时等。
¡ 应用:不同类型业务应用中参与计算的指标均不相同,需由具体的业务应用确定。
· 健康度
业务最新的健康度得分,基于业务内各服务主机/业务应用/设备的基础监控数据计算得出,表示业务健康程度。
健康度得分计算的影响因素:
服务主机/业务应用/网络设备:告警级别和数量。
· 可用度
业务最新的可用度得分,基于业务内各服务主机/业务应用/设备的基础监控数据计算得出,表示业务可用程度。
可用度得分计算的影响因素:
¡ 网络设备:对设备执行Ping操作。设备可达,网络设备可用度得分为100;设备不可达,网络设备可用度得分为0。
¡ 服务主机/业务应用:基于服务主机/业务应用的可用性。可用性包括可用、不可用、无法访问和未管理。
业务中各级繁忙度/健康度/可用度得分是通过下级得分或监控数据进行计算得出的。
· 各子元素的得分则是基于各项指标的基础监视数据计算得出的
· 各大类的得分是基于大类下各子元素的得分加权平均计算得出的
· 业务的各项得分是业务内服务主机、业务应用和网络设备三大类相应项的得分进行加权平均计算得出的
下面以业务繁忙度为例进行介绍,业务健康度和可用度与繁忙度计算方法相同。
繁忙度得分计算如图2-2所示。
· 计算子元素的繁忙度得分
对于一个子元素(服务主机、业务应用或网络设备),其繁忙度是由各指标值与权重进行加权计算得出。其中,权重会根据指标值动态调整,比如内存利用率指标,当其值属于[60,70]范围内时,对应权重为20;对于非百分制的指标,将其转换为百分制所对应的数值后参与计算,本例中Response值对应百分制值为100。
以服务主机Linux_172.16.1.2繁忙度得分计算为例,其计算方法如下:
繁忙度 = ∑(各指标值*权重)/总权重 = (15.00*1+61.10*20+0.75*1+100*80)/102=90.57
其他服务主机的繁忙度得分可依照此方法计算得出。
· 计算业务大类的繁忙度得分
业务大类繁忙度得分是由其大类下所有子元素的繁忙度加权平均计算得出。以服务主机大类的繁忙度得分为例,其计算方法如下:
服务主机繁忙度 = ∑(各子元素得分*权重)/总权重 = (90.57*1+15.91*1+11.64*1+7.71*1)/4=31.46
其他业务大类的繁忙度得分可依照此方法计算得出。
· 计算业务的繁忙度得分
业务繁忙度得分是由“服务主机”、“业务应用”以及“网络设备”大类的繁忙度加权平均计算得出。
业务ERP繁忙度 = ∑(各大类得分*权重)/总权重 = (31.46*5+1.04*2+19.26*1)/8=22.33
BSM通过大屏展示企业业务系统的整体运行情况,以及各个业务系统的运行健康情况和繁忙程度。传统的业务监视系统通常会在界面中堆砌大量的数据,使得界面信息繁杂且布局混乱,管理员很难通过这种界面了解各项业务的运行状况。
BSM的业务数据窗功能通过使用比例图、水晶球、分析曲线等形式,直观明了地展示了大量监视数据。业务数据窗不仅展示了业务系统的整体状态和详细运行情况,还通过健康度、繁忙度和可用度等指标对各业务进行评估和分析。业务数据窗如图3-1所示。
业务数据窗提供业务卡片、业务水晶球、数量统计分析等数据展示形式,直观展示已监控业务的实时运行情况。业务数据窗的数据每5分钟刷新一次。
点击“业务服务”页签,在左导航中选择“业务管理 > 业务数据窗”菜单项,进入业务数据窗页面,如图3-2所示。
业务数据窗简要介绍如下:
· 业务卡片:业务数据窗的上方是业务卡片滚动条,每个业务卡片展示一个业务的组成及运行状况。
· 数量统计分析:展示全部业务中基础设施的类型、数量和变化趋势,以及各部分的同比增长率。数量统计分析可通过个性化设定与业务得分统计切换显示。
· 业务水晶球:展示全部业务健康和繁忙的分布状况。
· 个性化设定:管理员可以自定义业务数据窗的展示内容。
· 搜索面板:展示每个业务的运行状况,还提供查询业务功能。
· 切换区域:提供切换至业务概览或数据中心鸟瞰图页面。
下面以其中一个业务卡片为例介绍,业务卡片如图3-3所示。
业务卡片详细介绍如下:
· 方框1:业务的名称。业务名称前面有图标表示该业务为关键业务,否则为普通业务。点击业务名称链接,可在展开的展示框中简要了解该业务子元素的运行情况。
¡ 点击“主机”图标,展示业务中所有服务主机的可用性及健康状况。
- 点击“健康状况”列名,即可按该列的健康状况进行排列。
- 点击“可用性”列名,即可按该列的可用性进行排列。
- 点击服务主机名称链接,弹出该服务主机的监视报表窗口,查看该服务主机的监视报表。
¡ 点击“应用”图标,展示业务中所有业务应用的可用性及健康状况。点击业务应用名称链接,弹出该业务应用的监视报表窗口,查看该业务应用的监视报表。
- 点击“健康状况”列名,即可按该列的健康状况进行排列。
- 点击“可用性”列名,即可按该列的可用性进行排列。
¡ 点击“网络”图标,展示业务中所有网络设备的状态。
- 点击“状态”列名,即可按该列的运行状态进行排列。
- 点击图标,收起该展示框。
· 方框2:该业务的繁忙度得分。通过齿轮的颜色和转动速度动态反映业务的繁忙程度,按照如下规则显示:
¡ 业务繁忙度得分为0~25分时,齿轮和得分值显示为绿色,转速较慢,表示业务较空闲。
¡ 业务繁忙度得分为26~74分时,齿轮和得分值显示为黄色,转速适中,表示业务较繁忙。
¡ 业务繁忙度得分为75~100分时,齿轮和得分值显示为红色,转速较快,表示业务很繁忙。
¡ 当繁忙度与可用度得分同时为0时,齿轮停止转动。
点击得分值链接,可查看该业务繁忙度得分计算明细,如图3-4所示。
¡ 业务、业务大类(服务主机、业务应用、网络设备)以及子元素的卡片背景颜色表示其繁忙程度。
¡ 点击服务主机/业务应用/网络设备业务大类的卡片展示相应子元素繁忙度得分情况。
¡ 点击各子元素的卡片展示其详细信息,以及影响繁忙度的指标值。
¡ 子元素卡片上右上角图标表示该子元素当前处于维护计划中。
¡ 子元素图标,表示该子元素处于不可用状态。
· 方框3:该业务的健康度得分。背景颜色的不同反映了业务的健康情况,按照如下规则显示:
¡ 业务健康度得分为0~25分时显示为红色,表示业务健康度较低。
¡ 业务健康度得分为26~74分时显示为黄色,表示业务健康度中等。
¡ 业务健康度得分为75~100分时显示为绿色,表示业务健康度较高。
· 方框4:该业务的可用度得分。背景颜色的不同反映了业务的可用程度,按照如下规则显示:
¡ 业务可用度得分为0~25分时显示为红色,表示业务可用程度较低。
¡ 业务可用度得分为26~74分时显示为黄色,表示业务可用程度中等。
¡ 业务可用度得分为75~100分时显示为绿色,表示业务可用程度较高。
· 方框5:该业务的告警统计。以柱状图形式分别展示告警级别为紧急、重要、次要、警告的告警数量。
¡ 鼠标移至相应告警级别的柱状图上,浮出该告警级别及数量信息。
¡ 点击告警柱状图页面跳转至该业务告警信息页面。
· 方框6:以环形图形式展示该业务的组成情况。其中,颜色为表示服务主机;颜色为表示业务应用;颜色为表示网络设备。鼠标分别移至环形图的各个区域显示该业务对应的服务主机、业务应用或网络设备的数量。
将鼠标移至各业务卡片上,相应业务卡片下方展开业务工具栏,提供容量、拓扑、告警、分析四个功能按钮。
· 单击<容量>按钮进入容量视图页面,查看该业务的容量使用情况。只有业务中包含服务主机,工具栏中才会显示容量功能按钮。
· 单击<拓扑>按钮进入资源拓扑页面,查看该业务的资源拓扑情况。
· 单击<告警>按钮进入告警信息页面,查看业务的所有告警信息。
· 单击<分析>按钮进入基于时间轴分析页面,针对业务的得分进行基于时间的分析。
当业务数量较多时,业务数据窗不能显示全部的业务卡片,为了便于查看可以通过点击或图标向右或向左滑动业务卡片。
数量统计分析从“服务器”、“网络设备”、“业务应用”以及“操作系统”四个部分分别展示全部业务中基础设施的类型、数量和数量的变化趋势,以及各部分的同比增长率,如图3-5所示。
· 方框1:数量坐标。
· 方框2:同比增长率坐标。
· 方框3:数量柱形图和同比增长率趋势图。将鼠标移至柱形图或趋势图上,显示当月基础设施的类型和数量以及同比增长率。
数量统计分析是按月进行统计,以柱状图的形式展示业务中基础设施的类型和数量。
· 服务器数量统计:展示全部业务中所包含的服务器数量。将鼠标移至柱形图或折线图上,可以查看对应月份的服务器数量以及同比增长率信息。
· 网络设备数量统计:展示全部业务中所包含的网络设备类型及数量。网络设备类型包括路由器、交换机、安全设备和其他设备。其中,柱状图中颜色表示路由器;颜色表示交换机;颜色表示安全设备;颜色表示其他设备。将鼠标移至柱形图或折线图上,可以查看对应月份包含网络设备的类型和数量及同比增长率。
· 业务应用数量统计:展示全部业务中所包含的业务应用类型及数量。业务应用类型包括数据库、中间件和Web服务器。其中,颜色表示数据库;颜色表示中间件;颜色表示Web服务器。将鼠标移至柱形图或折线图上,可以查看对应月份包含业务应用的类型和数量及同比增长率。
· 操作系统数量统计:展示全部业务中所包含的操作系统类型及数量。操作系统类型包括Windows、Linux和Unix。其中,颜色表示Windows;颜色表示Linux;颜色表示Unix。鼠标移至柱形图或折线图上,可以查看对应月份包含操作系统的类型和数量及同比增长率。
业务水晶球如图3-6所示,从健康度和繁忙度两个角度展示全部业务健康和繁忙的分布状况,同时展示全部业务的得分及告警情况。
业务水晶球详细介绍如下:
· 业务总数:业务管理系统中全部业务的总数。
· 业务水晶球:将业务的健康度和繁忙度得分划分为“很高”、“高”、“中”、“低”、“很低”五个类别,展示各得分类别中业务的数量。点击图例名称可在业务水晶球中显示/隐藏相应图例的数量分布情况。具体划分规则如下:
¡ 得分范围0~19分,为“很低”。
¡ 得分范围20~39分,为“低”。
¡ 得分范围40~59分,为“中等”。
¡ 得分范围60~79分,为“高”。
¡ 得分范围80~100分,为“很高”。
· 从健康度、繁忙度、可用度以及告警四个角度统计全部业务的得分及告警情况。分别点击“健康”、“繁忙”、“可用”、“告警”链接,改变业务概览中业务的排序依据和业务概览区域的背景颜色。
¡ 健康:显示健康度得分处于60~100的业务的数量。
¡ 繁忙:显示繁忙度得分处于60~100的业务的数量。
¡ 可用:显示可用性得分处于60~100的业务的数量。
¡ 告警:全部业务的告警数量总和,不统计重复告警。
· 业务概览:从健康度、繁忙度、可用度以及告警四个角度展示全部业务的得分及告警排名情况。当业务数据窗个性化设定为显示业务得分统计时,业务水晶球区域不显示业务概览。
¡ 健康:按照健康度得分由低到高的顺序显示业务的排名列表。
¡ 繁忙:按照繁忙度得分由低到高的顺序显示业务的排名列表。
¡ 可用:按照可用度得分由低到高的顺序显示业务的排名列表。
¡ 告警:按照业务的告警数量由低到高的顺序显示业务的排名列表。
¡ 点击图标或图标切换业务得分/告警数量下降或上升顺序显示业务的排名列表。
¡ 点击或图标向上或向下滑动显示业务得分/告警信息。
业务数据窗个性化设定可以自定义业务数据窗的显示内容。
(1) 点击图标,弹出业务数据窗个性化设定对话框如图3-7所示,设置如下参数:
· 数据窗名称:业务数据窗显示的名称。名称不能为空,且长度不能超过30个字符。
· 标题大小:数据窗名称字体的大小,包括大、中、小。
· 展示内容:选择业务数据窗左下角展示的内容,可选数量统计分析或业务得分统计。
(2) 单击<保存>按钮,完成设定。个性化设定会在保存成功后最长一分钟左右生效。
搜索面板根据业务优先级别将业务划分为关键业务和普通业务,并通过业务小卡片的形式展示每个业务的运行状况,使管理员实时掌握业务的运行状况。搜索面板还提供业务查询功能,快速搜索到查询的业务。
打开/关闭搜索面板方法如下:
在业务数据窗页面,点击右上角的“打开搜索面板”图标,展开搜索面板;在搜索面板中,点击右上角的图标,关闭搜索面板。
(1) 查看搜索面板展示信息
下面以其中一个业务小卡片进行介绍,如图3-8所示。
小卡片展示了业务的名称、业务告警、繁忙度和健康度得分,以及可用情况。其中:
· 繁忙度:该业务的繁忙度得分。点击得分值链接,可查看该业务繁忙度得分计算明细。齿轮颜色反映了业务当前的繁忙程度,齿轮颜色按照如下规则显示:
¡ 业务繁忙度得分为0~25分时,齿轮显示为绿色,表示业务较空闲。
¡ 业务繁忙度得分为26~74分时,齿轮显示为黄色,表示业务较繁忙。
¡ 业务繁忙度得分为75~100分时,齿轮显示为红色,表示业务很繁忙。
· 健康度:该业务的健康度得分。健康度状态条颜色反映了业务当前的健康情况,状态条颜色按照如下规则显示:
¡ 业务健康度得分为0~25分时显示为红色,表示业务健康度较低。
¡ 业务健康度得分为26~74分时显示为黄色,表示业务健康度中等。
¡ 业务健康度得分为75~100分时显示为绿色,表示业务健康度较高。
· 当业务可用度得分为0时,业务小卡片边框颜色变为红色,表示业务不可用。
· 告警:该业务中存在未恢复最高级别的告警,数字代表告警的数量,颜色代表告警的等级。点击告警图标,页面跳转至该业务告警信息页面。
将鼠标移至业务小卡片上,业务小卡片下方展开业务工具栏,提供容量、拓扑、告警、分析四个功能按钮。
· 单击<容量>按钮进入容量视图页面,查看该业务的容量使用情况。只有业务中包含服务主机,工具栏中才会显示容量功能按钮。
· 单击<拓扑>按钮进入资源拓扑页面,查看该业务的资源拓扑情况。
· 单击<告警>按钮进入告警信息页面,查看业务的所有告警信息。
· 单击<分析>按钮进入基于时间轴分析页面,针对业务的得分进行基于时间的分析。
(2) 搜索业务
a. 在搜索面板上方的查询框中输入业务的名称。业务名称支持模糊匹配。
b. 点击即可完成查询,查询结果显示在搜索面板中。
c. 点击重置查询条件,搜索面板中显示所有业务。
“业务数据窗”页面可以切换为“业务概览”页面或“数据中心鸟瞰图”页面。切换方法如下:
(1) 将鼠标移至页面顶部,弹出界面切换面板。
(2) 在切换面板中,选择窗口显示的页面,可选页面包括业务概览、业务数据窗和数据中心鸟瞰图。
业务容量视图展示业务中服务主机容量概况以及容量负载情况及增长趋势曲线。该功能可以帮助管理员定位业务性能瓶颈,并提供容量预警及扩容建议。
进入容量视图页面的方法:
在业务数据窗页面,鼠标移至某一业务卡片上,业务卡片下方展开业务工具栏,单击<容量>按钮,进入该业务容量视图页面,如图3-9所示。
页面上方的小卡片,显示了该业务的繁忙度、可用度、健康度得分。将鼠标移至小卡片上,分别单击工具栏的<容量>、<拓扑>、<告警>和<分析>按钮切换至相应页面。将鼠标移至窗口顶部可切换至业务概览或数据中心鸟瞰图页面。
容量概览展示业务中主机部分的容量使用情况、容量效率和容量预测趋势图。
· 容量概况:业务中服务主机的CPU/内存/磁盘的总容量及已使用的CPU/内存/磁盘情况。统计操作系统类型为Windows和Linux的服务主机,暂不支持对操作系统类型为Unix的服务主机的统计。
· 容量效率:根据CPU/内存/磁盘平均利用率计算得出。容量效率越高,则业务使用率越高,同时,管理员可根据业务需求适当进行扩容。
· 容量预测:根据最近15天获取的性能数据计算出CPU/内存/磁盘利用率上升最快的Top3服务主机的趋势图,并预测其达到100%的时间。将鼠标移至曲线上可以看到各采样点具体信息。
¡ 点击图例名称可在趋势图中显示/隐藏监控指标及容量趋势。
¡ 分别点击页签在CPU、内存与磁盘容量瓶颈间切换,方框2区域显示相应容量风险Top3服务主机。
¡ 在方框2区域中,点击服务主机名称链接,CPU/内存/磁盘容量瓶颈显示该服务主机趋势图。
点击图标查看容量详情,展示如下信息:
· 业务中所有服务主机CPU/内存/磁盘平均利用率的曲线图。点击图例名称可在曲线图中显示/隐藏监控指标。
· 以列表的形式展示业务中各服务主机CPU/内存/磁盘利用率详情。
从CPU负载、内存负载及磁盘负载三个方面展示业务中所有服务主机的容量利用率、容量利用率概览趋势图及利用率最高的Top5主机。
· 容量利用率:展示最近24小时的性能数据,便于了解容量利用率情况。
¡ 平均利用率:业务中所有服务主机CPU/内存/磁盘的平均利用率。
¡ 利用率峰值:业务中所有服务主机CPU/内存/磁盘的最高利用率。
¡ 利用率波动:业务中所有服务主机CPU/内存/磁盘利用率波动的平均值。利用率波动指同一采样点利用率最大值与最小值之间的差值。
· 容量利用率概览:展示最近24小时的CPU/内存/磁盘利用率曲线图,包括最大值、最小值和平均值趋势图以及容量阈值。点击图例名称可在趋势图中显示/隐藏监控指标曲线图。
· 利用率最高的主机Top5:根据最近一次轮询获取的采样数据,业务中所有主机中最高的5个服务主机CPU/内存/磁盘利用率值。将鼠标移至柱形图上可以看到各服务主机信息及利用率值。
点击图标折叠CPU/内存/磁盘负载,点击图标展开显示CPU/内存/磁盘负载。
资源拓扑展示了该业务的使用者分组、资源组成情况以及拓扑结构。
进入业务资源拓扑页面的方法:
在业务数据窗页面,鼠标移至某一业务卡片上,业务卡片下方展开业务工具栏,单击<拓扑>按钮,进入该业务资源拓扑页面,如图3-10所示。
展示该业务的使用者分组。当业务异常时,管理员可查看受影响的部门。业务组成根据业务大类列出该业务的资源组成情况,包括服务主机、业务应用、网络设备。点击服务主机/业务应用的名称链接查看其监视报表。
拓扑结构展示了应用、主机、接入设备、物理网络这四类对象之间的物理关系和逻辑关系。点击图标,放大显示拓扑结构。
· 物理关系包括:接入设备与物理网络之间的连接关系,主机与接入设备之间的连接关系,操作系统类应用与主机之间的宿主关系。
· 逻辑关系包括:非操作系统类应用与操作系统之间的依赖关系,各种应用之间的依赖关系。
拓扑结构中图例说明如表3-1所示。
图标 |
名称 |
描述 |
|
主机 |
该主机上的操作系统未被该业务监视。 |
|
主机 |
该主机上的操作系统已被该业务监视,主机上的图标代表了操作系统的类型,该图标表明主机上运行了Windows操作系统。 |
|
应用 |
每个服务主机和业务应用都有其对应的图标。该图标表明这个是一个Oracle数据库。 |
|
告警 |
服务主机/应用/网络设备存在未恢复的告警,数字代表告警的数量,颜色代表告警的等级。 |
可用性 |
最近一次轮询应用时,应用的可用性。 |
|
健康状况 |
最近一次轮询应用时,应用的健康状况。 |
|
|
接入设备 |
服务主机通过该设备接入网络。接入设备颜色代表告警的等级。只有加入了U-Center的设备才能在拓扑中显示。 |
|
物理网络 |
表示接入设备所连接的网络。 |
依赖关系 |
相同IP地址应用之间的依赖关系,实线表示直接依赖,虚线表示间接依赖。 |
|
依赖关系 |
不同IP地址应用之间的依赖关系,实线表示直接依赖,虚线表示间接依赖。 |
|
网络连接 |
服务主机与接入设备之间,接入设备与物理网络之间的连接关系,实线表示直接连接,虚线表示间接连接。服务主机与接入设备之间的连线上标明了服务主机接入的端口编号。 |
· 应用之间的间接依赖是由于当前操作员只能管理部分应用监视造成的,例如C依赖于B,B依赖于A,操作员只有应用C和A的管理权限,因此在拓扑中显示为C间接依赖于A。操作员对应用的管理权限设置是通过应用分组功能实现的。
· 间接连接只能产生于主机和物理网络之间,这是由于接入设备没有加入U-Center造成的。
拓扑基本功能如表3-2所示。
功能 |
说明 |
|
单击该按钮将鼠标指针置于选择状态,操作员可以在拓扑中选择、拖拽节点。打开拓扑时,鼠标指针默认为选择状态。 |
|
单击该按钮将鼠标指针置于放大镜状态,在拓扑窗口中移动鼠标可以对拓扑进行局部放大。 |
|
单击该按钮开启/关闭应用拓扑的鸟瞰图。 |
|
单击该按钮将拓扑放大。 |
|
单击该按钮将拓扑缩小。 |
|
单击该按钮将拓扑重置为原始大小。 |
|
单击该按钮将拓扑根据窗口大小进行调整,使其全部显示在窗口中。 |
|
单击该按钮生成当前拓扑的快照图片。 |
|
单击该按钮更新拓扑的布局。 |
|
单击该按钮将拓扑中的设备垂直布局。 |
|
选中两个节点后,单击该按钮自定义其关系。 |
|
单击该按钮恢复已删除的关系。 |
|
选择“隐藏接口”菜单项后,拓扑中所有服务主机连接到接入设备的接口编号将被隐藏。 选择“显示接口”菜单项后,拓扑中所有服务主机连接到接入设备的接口编号将会显示。 |
选择“隐藏名称”菜单项后,拓扑中所有节点和网络的名称将被隐藏。 选择“显示名称”菜单项后,拓扑中所有节点和网络的名称将会显示。 |
|
|
操作员在拓扑中调整完设备/应用的位置后,单击该按钮保存当前拓扑结构。 |
|
拓扑的鸟瞰图,通过该图可以看出当前拓扑窗口在整个拓扑中的相对位置。单击<鸟瞰图>按钮开启/关闭资源拓扑的鸟瞰图。 |
· 右键菜单:点击“应用监视”菜单项,打开服务主机操作系统或业务应用的监视报表。只有服务主机或业务应用才有右键菜单,且服务主机操作系统必须被该业务监视。
· 鼠标移至服务主机/业务应用/网络设备图标上可以看到其详细信息。
¡ 服务主机/业务应用
- 名称:显示服务主机/业务应用的名称。
- 可用性:显示服务主机/业务应用的可用性,包括正常运行、不可用、无法访问和未管理。
- 健康状况:显示服务主机/业务应用的健康状况,包括健康、次要、重要、紧急和未知。
- IP地址:显示该服务主机/业务应用的IP地址。
- 应用类型:显示该服务主机的操作系统的类型或业务应用的类型。
- 联系人/联系方式:显示该服务主机/业务应用的负责人及联系方式,当故障发生时,通知联系人快速解决问题。
¡ 网络设备
- 设备标签:显示该设备的标签。
- IP地址:显示该设备的IP地址。
- 掩码:显示该设备IP地址的子网掩码。
- 设备状态:显示该设备的状态。
- 系统名称:显示该设备的系统名称。
- 制造厂商:显示该设备的制造厂商。
- 联系人/联系方式:显示该网络设备的负责人及联系方式,当故障发生时,通知联系人快速解决问题。
自定义关系功能帮助操作员管理拓扑中各节点之间的关系,可以根据需要自定义两个节点的关系,删除或恢复原有的关系。
增加自定义关系帮助操作员自定义两个节点的关系,包括物理关系和逻辑关系。仅当两个节点之间不存在任何链路或关系时,才可以增加自定义关系。
a. 在拓扑中,选中两个节点。
b. 点击“自定义关系”图标,弹出自定义关系窗口。
c. 输入关系的描述信息。
d. 选择关系的方向。
· 有方向:设置为逻辑关系。
选择该项后,还需选择其依赖关系的方向。
· 无方向:设置为物理关系。
a. 选择关系的类型。可选类型包括直接关系或间接关系。
b. 单击<确定>按钮,完成增加自定义关系。
c. 点击拓扑工具栏中“保存”图标,保存拓扑。
(2) 删除关系
删除关系功能用于删除两个节点之间的链路或关系,包括预定义关系和自定义关系。自定义关系删除后不可恢复。
a. 在拓扑中,右键单击待删除关系。
b. 在弹出菜单中选择“删除”菜单项。
c. 点击拓扑工具栏中“保存”图标,保存拓扑。
恢复关系功能用于恢复已删除的关系。仅能恢复预定义关系。
a. 点击拓扑工具栏中“恢复关系”图标,弹出恢复关系窗口。列表中显示所有已删除的预定义关系。
b. 单击待恢复关系前的<恢复>按钮,恢复所选关系。
c. 单击<关闭>按钮,关闭恢复关系窗口。
d. 点击拓扑工具栏中“保存”图标,保存拓扑。
业务告警信息提供某一业务的全部告警信息,并且可以分别查看该业务所包含的网络设备、主机、业务应用以及该业务的告警信息。
在业务数据窗页面,鼠标移至某一业务卡片上,业务卡片下方展开业务工具栏,单击<告警>按钮,进入该业务告警信息页面,如图3-11所示。
点击“全部类型”、“业务告警”“服务器主机”、“业务应用”和“网络设备”页签,可以查看不同类型的告警信息。业务告警信息列表中各列的说明如下:
· 级别:告警的级别,包括紧急、重要、次要、警告。
· 告警来源:产生告警的设备名称(IP地址)。
· 类型:产生告警的类型,包括Trap、iMC、Syslog。
· 告警信息:触发告警产生条件的描述信息。
· 告警时间:告警产生的时间。
· 持续时间:告警持续的时间。
业务分析是基于时间分析业务繁忙度和健康度得分以及业务子元素的指标在一段时间内的变化趋势,使管理员能准确定位故障根源、快速恢复业务。
进入业务分析页面的方法如下:
在业务数据窗页面,鼠标移至某一业务卡片上,业务卡片下方展开业务工具栏,单击<分析>按钮,进入该业务基于时间轴分析页面,如图3-12所示。
点击图标设置查看基于时间轴分析和宕机比率统计的时间范围。
· 点击“指定时间”图标,设置开始时间和结束时间,查看该时间范围内的统计数据。
· 点击“最近1小时”图标、“最近6小时”图标、“今天”图标、“昨天”图标、“本周”图标、“本月”图标、“本年”图标查看相应时间段内的历史数据。
基于时间轴分析通过绘制基于时间的曲线图,向用户展示了业务整体的得分趋势,业务中各大类的得分趋势以及每个业务大类中各子元素的趋势。
· 分析展示区域的左侧,展示了业务和业务大类基于时间的分析。点击不同业务大类标题栏右端的图标,可以查看对应业务大类下各子元素基于时间的分析。
¡ 业务(标题栏颜色为)栏中展示了整个业务繁忙度和健康度得分的变化趋势曲线图。
¡ 业务大类分为服务主机(标题栏颜色为)、业务应用(标题栏颜色为)和网络设备(标题栏颜色为)三栏,分别展示了各业务大类繁忙度和健康度得分的变化趋势曲线图。
· 分析展示区域的右侧,展示了业务大类中子元素得分以及影响各子元素繁忙度或健康度的指标基于时间的分析。点击各服务主机/业务应用标题栏,查看该服务主机/应用的监视报表。
¡ 展示了业务各子元素繁忙度和健康度得分的变化趋势曲线图。
¡ 展示了业务各子元素影响繁忙度的指标的变化趋势曲线图。显示指标的规则说明如下:
- 服务主机/业务应用:显示影响繁忙度的指标以及在APM中启用阈值的指标。对于通过端口进行监控的应用,在NTA模块中创建了接口流量分析任务后,会在此区域中展示其流量趋势曲线图。
- 网络设备:显示影响繁忙度的指标以及监视的网络设备的接口带宽利用率指标。只有在U-Center的资源管理中启用监视的接口,才能正确获取到接口输入/输出带宽利用率数据。
将鼠标移至坐标系内的不同位置,显示内容不同:
· 将鼠标移至业务或业务大类的坐标系中,可查看各采样时间点对应的繁忙度和健康度得分。繁忙度和健康度得分颜色按照如下规则显示:
¡ 健康度
- 得分为0~25分时显示为红色。
- 得分为26~74分时显示为黄色。
- 得分为75~100分时显示为绿色。
¡ 繁忙度
- 得分为0~25分时显示为绿色。
- 得分为26~74分时显示为黄色。
- 得分为75~100分时显示为红色。
· 将鼠标移至各项指标的坐标系中,可查看各采样时间点对应的指标值。指标值颜色按照如下规则显示:
¡ 在APM中启用阈值的服务主机/业务应用的指标。
- 未达到一级阈值,显示为绿色。
- 超过一级阈值,显示同重要级别告警的颜色。
- 超过二级阈值,显示同紧急级别告警的颜色。
¡ 网络设备及未启用阈值的服务主机/业务应用的指标。
- 指标值范围0~15显示为绿色。
- 指标值范围16~74显示为黄色。
- 指标值范围75~100显示为红色。
· 在任意坐标系中,将鼠标移至趋势曲线上任意一点,可以查看距离该点最近的采样时间点对应的得分或指标值,同时页面中其他坐标系也会显示该采样时间点对应的得分或指标值。
当业务得分变化趋势曲线图陡变时,管理员可通过观察服务主机、业务应用、网络设备得分变化趋势曲线图判断影响业务得分异常的大类,再根据各服务主机/业务应用/网络设备的得分变化趋势曲线图判断是否出现异常,最后根据各指标曲线图确定故障根源。
业务基本信息展示如下内容:
· 名称:业务的名称。
· 优先级:业务的优先级。
· 联系人:业务的负责人。
· 最后轮询时间:BSM最近一次轮询获得数据的时间。
· 繁忙度:业务最近一次得分计算的繁忙度得分。
· 健康度:业务最近一次得分计算的健康度得分。
当业务可用度得分为0时,业务将被视为宕机,即业务处于不可用状态。
宕机比率统计展示如下信息:
· 饼图:业务最近一段时间内宕机的百分比。将鼠标移至饼图的分片上可以看到相应分片的百分比数据。点击图例名称可在饼图中显示/隐藏相应图例的百分比。
¡ 正常运行:统计时间段内,业务正常运行状态累计时长占统计时长的百分比。
¡ 不可用:统计时间段内,业务累计不可用的时长。业务不可用状态累计时长占统计时长的百分比。
¡ 未知:统计时间段内,业务未加入BSM监视的累计时长占统计时长的百分比。
· 平均无故障运行时间:统计时间段内,业务持续正常运行时长的平均值。当业务持续未发生宕机,则显示为暂无数据。
· 平均故障恢复时间:统计时间段内,业务宕机持续时长的平均值。当业务持续未发生宕机,则显示为暂无数据。
业务告警统计以服务主机、业务应用、网络设备业务大类和业务为统计单位,以条形图展示其告警情况,如图3-13所示。
· 条形图总长度表示该部分产生的告警总数。
· 条形图中包含的颜色表示包含了该级别的告警,其中:
¡ 条形图颜色为表示警告级别告警。
¡ 条形图颜色为表示次要级别告警。
¡ 条形图颜色为表示重要级别告警。
¡ 条形图颜色为表示紧急级别告警。
· 将鼠标移至相应颜色的条形图上,可查看告警的级别及数量。
UEM(User Experience Management)数字化体验管理是BSM(业务服务管理)组件的一个新增功能项。UEM通过采集用户使用Web浏览器访问业务系统的真实体验数据,从而分析出业务响应时间、错误、页面点击数量、用户来源、AJAX性能等关键KPI指标,并进而计算出Apdex(应用性能指数Application Performance Index)。
可以在新增业务监视时启用浏览器监控,添加监控名称,然后在体验度配置中进行更多的参数配置,最后通过复制和下载,将生成的JavaScript代码根据部署步骤嵌入相应系统中。
增加业务如图4-1所示。
启用浏览器监控如图4-2所示。
图4-3 修改参数
图4-4 阈值设置
图4-5 关键页面设置
可以针对VIP用户的IP进行配置,可以查看VIP用户的访问情况,如图4-6所示。
图4-6 VIP设置
提供多种方式查看用户体验监控信息如错误!未找到引用源。所示。
图4-7 业务监视
图4-8 体验度
体验度DashBoard主要展示业务用户体验的概览,包括用户体验趋势、区域性能概览、Apdex指数、JS错误和访问成功率等。体验度DashBoard如图4-10所示。
每个页面的详情信息,趋势,区域性能,JS错误等。监控页面如图4-11所示。
图4-12 页面分析
图4-13 区域
图4-14 JS错误
图4-15 VIP用户
业务概览用于展示业务的简要状态信息。业务概览根据业务优先级别将业务划分为关键业务和普通业务,并通过卡片的形式展示每个业务的健康状况。通过业务概览,管理员可以快速掌握所有业务的运行情况。
进入业务概览窗口的方法如下:
点击“业务服务”页签,在左导航中选择“业务管理 > 业务概览”菜单项,进入业务概览页面,业务概览如图5-1所示。
窗口中业务以卡片的形式分别展示在关键业务和普通业务两栏中。其中,关键业务展示了业务优先级为关键的业务,普通业务展示了业务优先级为普通的业务。
如图5-1方框1,业务卡片中包含了代表业务状态的齿轮和业务名称。业务卡片内容的介绍如下:
· 状态齿轮:该齿轮通过颜色和转速展示了业务当前的状态。齿轮的颜色与转动速度按照如下规则显示:
¡ 业务繁忙度得分为0~15分时,齿轮显示为绿色,转动较慢,表示业务比较闲。
¡ 业务繁忙度得分为16~74分时,齿轮显示为黄色,转动中等,表示业务较繁忙。
¡ 业务繁忙度得分为75~100分时,齿轮显示为红色,转动较快,表示业务很繁忙。
· 业务名称:卡片所展示业务的名称。
将鼠标移动到业务卡片上,将浮出该业务的得分信息,包括繁忙度得分、可用度得分和健康度得分。
当业务的健康度得分或可用度得分小于25分时,卡片的背景显示为红色,如图5-1方框2中的业务卡片。此时,可以查看该红色卡片告警信息。查看告警信息的方法如下:
(1) 点击背景为红色的卡片,弹出该业务的告警信息窗口。
(2) 在告警信息窗口中,展示了告警信息列表。点击“全部类型”、“业务告警”“服务器主机”、“业务应用”和“网络设备”页签,可以查看不同类型的告警信息。业务告警信息列表中各列的说明如下:
¡ 级别:告警的级别。包括紧急、重要、次要、警告。
¡ 告警来源:产生告警的设备名称(IP地址)。
¡ 类型:产生告警的类型,包括Trap、iMC、Syslog。
¡ 告警信息:触发告警产生条件的描述信息。点击告警信息链接,iMC主页面跳转至该告警的详细信息页面。
¡ 告警时间:告警产生的时间。
¡ 持续时间:告警持续的时间。
“业务概览”页面可以切换为“业务数据窗”页面或“数据中心鸟瞰图”页面。切换方法如下:
(1) 将鼠标移至窗口顶部,如图5-1方框3中的区域,窗口顶部弹出界面切换面板。
(2) 在切换面板中,选择窗口显示的页面,可选页面包括业务概览、业务数据窗和数据中心鸟瞰图。
窗口中业务以卡片的形式分别展示了关键和普通两个级别的业务。
业务监视用于监视网络中的业务,监视对象包括业务中的网络设备、服务器和应用。业务监视通过可用度、繁忙度、健康度来评估被监控业务的可用性、繁忙度和健康状况。本章将介绍业务监视管理和监视参数的配置,如图图6-1所示。
(1) 点击“业务服务”页签,在左导航中选择“业务管理 > 业务监视”菜单项,进入业务监视页面。
(2) 列表中各列的说明如下:
· 名称:业务的名称。点击业务名称链接可以查看该业务详细信息。
· 优先级:业务的优先级,包括关键和普通。
· 联系人:业务的联系人。
· 可用度:业务最近一次的可用度得分。可用度得分越高,则业务可用性越高。
· 健康度:业务最近一次的健康度得分。健康度得分越高,则业务越健康。
· 繁忙度:业务最近一次的繁忙度得分。繁忙度得分越高,则业务越繁忙。
· 拓扑:点击“拓扑”图标查看该业务的拓扑结构。
· 阈值配置:点击“阈值配置”图标配置业务阈值。
· 权重分配:点击“权重分配”图标配置业务权重。
· 修改:点击“修改”图标修改对应业务。
· 删除:点击“删除”图标删除对应业务。
(3) 列表上方功能栏中各功能的说明如下:
· 增加:增加新的业务。
· 刷新:刷新并获得最新的业务监视数据。
· 删除:删除一个或多个业务。
(1) 在业务监视列表中点击业务对应的名称链接,进入业务详细信息页面。
业务详细信息包含如下内容:
· 名称:业务的名称。
· 描述:业务的描述信息。
· 优先级:业务的优先级。
· 联系人:负责业务的联系人。
· 用户分组:业务中受影响的用户分组。
· 应用:业务中所包含的应用。
· 网络设备:业务中所包含的网络设备。
· 网络设备接口列表:显示业务监视的网络设备的接口信息。
¡ 状态:网络设备接口的状态,包括Up和Down。
¡ 接口描述:网络设备接口的描述。
¡ 接口IP:网络设备接口的IP地址。
¡ 设备名称:接口所属的网络设备的名称。
· 业务分组:控制操作员对业务的管理权限。
(2) 单击<返回>按钮,返回业务监视页面。
(1) 在业务监视页面,单击<增加>按钮,进入增加业务页面。
(2) 输入业务的名称。名称必须唯一,且名称长度不能超过32个字符。
(3) 输入业务的描述信息。
(4) 选择业务的优先级。
· 普通:设置业务的优先级为普通。
· 关键:设置业务的优先级为关键,使关键业务得到重点关注。
(5) 输入业务的联系人。默认为当前登录的操作员。
(6) 选择业务影响的用户分组。用户分组需预先在“系统管理 > 分组管理 > 用户分组”中配置。
· 增加用户分组
a. 单击<增加>按钮,弹出“增加用户分组”窗口。
b. 输入分组名称和分组描述。
c. 单击<确定>按钮,完成增加。
· 删除用户分组
a. 点击“删除”图标,完成删除。
(7) 选择业务监视的应用。业务包含的应用不能超过100个。应用需预先在“资源管理 > 应用 > 应用列表”中配置。
· 增加应用
a. 单击<增加>按钮,弹出“选择应用”窗口。
b. 选中一个或多个应用。如果应用列表中应用较多,可通过在列表上方的查询框中输入应用名称进行筛选。
c. 单击<确定>按钮,增加的应用显示在“应用”文本框中。
· 删除应用
a. 在“应用”文本框选择一个或多个应用。
b. 单击<删除>按钮,删除选择的应用。
c. 选择网络设备。业务包含的网络设备不能超过20个。网络需预先在“资源管理 > 资源纳管 > 增加资源”中配置。
· 增加网络设备
单击“网络设备”文本框右侧的<增加>按钮,弹出“选择网络设备”窗口,选择一个或多个网络设备。
· 删除网络设备
a. 在“网络设备”文本框选择一个或多个网络设备。
b. 单击<删除>按钮,删除选择的网络设备。
(8) 勾选是否选择接口,展开网络设备接口列表。业务包含的网络设备接口不能超过50个。
· 添加设备接口
a. 在网络设备接口列表中,单击<添加设备接口>按钮,弹出“添加设备接口”窗口。
b. 在接口列表中,选择业务监视的网络设备的接口,如图6-2所示。如果业务中未增加网络设备,则接口列表为空。
c. 单击<确定>按钮,添加的网络设备接口显示在网络设备接口列表中。
· 删除设备接口
a. 在网络设备接口列表中选择一个或多个设备接口。
b. 单击<删除>按钮,删除选择的设备接口。
(9) 单击<确定>按钮,完成增加业务监视。
在业务监视列表中,点击待删除业务对应的“删除”图标,弹出确认对话框。单击<确定>按钮,删除该业务。
在业务监视列表中,选择一个或多个待删除业务。单击<删除>按钮,弹出确认对话框。单击<确定>按钮,删除所选业务。
(1) 在业务监视列表中,点击待修改业务对应“修改”图标,进入修改业务监视页面。
(2) 修改业务的参数。修改完成后,单击<确定>按钮。
业务查询的方法有两种,包括简单查询和高级查询。
(1) 在业务监视列表右上角的查询框中输入业务的名称。业务名称支持模糊匹配。
(2) 点击即可完成查询,查询结果显示在业务监视列表中。
(1) 点击查询框右侧的“高级”图标,展开查询区域。
(2) 配置查询条件:
· 名称:业务的名称。该查询条件支持模糊匹配。
· 优先级:在下拉框中选择业务优先级,包括不限、普通、关键。
任意查询条件保持为空或选择为不限,则表示不将此查询条件作为过滤条件。
(3) 单击<查询>按钮,业务监视列表中显示符合查询条件的业务。
(4) 单击<重置>按钮,所有查询条件重置为缺省值,业务监视列表中显示所有业务。
(5) 单击<关闭>按钮,关闭高级查询。
阈值是指BSM在监视业务时,业务可用度、健康度、繁忙度以及容量的告警阈值。当业务可用度得分、健康度得分、繁忙度得分以及容量指标满足阈值条件时,BSM会通过U-Center的告警模块发送业务级别的阈值告警。
在业务监视列表中,点击待配置业务对应的“阈值配置”图标,进入业务阈值配置页面。
(1) 可用度、健康度、繁忙度阈值配置
可以通过点击“可用度”、“健康度”和“繁忙度”页签在可用度阈值配置、健康度阈值配置与繁忙度阈值配置间切换。
a. 配置阈值条件
¡ 大于等于:阈值条件设置为大于等于时,当业务的可用度得分/健康度得分/繁忙度得分大于等于设定阈值时,会产生业务阈值告警。
¡ 小于等于:阈值条件设置为小于等于时,当业务的可用度得分/健康度得分/繁忙度得分小于等于设定阈值时,会产生业务阈值告警。
b. 配置一级阈值参数
业务的可用度得分/健康度得分/繁忙度得分满足一级阈值的告警条件时,BSM会发送重要级别的告警。
¡ 是否启用:在“一级阈值”下的“是否启用”下拉框中选择是否启用一级阈值。
¡ 阈值:启用一级阈值后,在“阈值”文本框中输入一级阈值,默认为30。阈值必须为大于0小于100的数字,小数点后最多两位。
如果一级阈值与二级阈值同时启用,阈值的设置分为两种情况:
- 阈值条件为“大于等于”时,一级阈值不能大于二级阈值。
- 阈值条件为“小于等于”时,一级阈值不能小于二级阈值。
¡ 触发告警频率:启用一级阈值后,在“触发告警频率”文本框中输入阈值的告警触发次数。得分超过一级阈值一次记为1,在超过“触发告警频率”指定的次数后触发一次一级阈值的告警。
c. 配置二级阈值参数
业务的可用度得分/健康度得分/繁忙度得分在满足二级阈值告警条件时,BSM会发送紧急级别的业务告警。
¡ 是否启用:在“二级阈值”下的“是否启用”下拉框中选择是否启用二级阈值。
¡ 阈值:启用二级阈值后,在“阈值”文本框中输入二级阈值,默认为70。
¡ 触发告警频率:启用一级阈值后,在“触发告警频率”文本框中输入阈值的告警触发次数。得分超过一级阈值一次记为1,在超过“触发告警频率”指定的次数后触发一次二级阈值的告警。
单击<确定>按钮,保存配置。单击<返回>按钮,返回至业务监视页面。
(2) 业务容量指标阈值设置
a. 点击“容量”页签,显示容量指标阈值设置。
b. 配置如下参数:
¡ CPU利用率(%):设置触发告警的CPU利用率的阈值。当业务的CPU利用率平均值超过设定的阈值时产生紧急级别的业务告警。
¡ 内存利用率(%):设置触发告警的内存利用率的阈值。当业务的内存利用率平均值超过设定的阈值时产生紧急级别的业务告警。
¡ 磁盘利用率(%):设置触发告警的磁盘利用率的阈值。当业务的磁盘利用率平均值超过设定的阈值时产生紧急级别的业务告警。
c. 单击<确定>按钮,保存配置。
d. 单击<返回>按钮,返回至业务监视页面。
业务权重分配主要用于调整业务中各个部分的权重,突出业务中权重值大的重要应用或设备对业务可用度、健康度和繁忙度的影响。
业务权重分配包括对业务大类(服务主机、业务应用、网络设备)的可用度权重、健康度权重和繁忙度权重配置以及各大类下具体的应用和设备的可用度权重、健康度权重和繁忙度权重配置。权重值必须为0到100的整数,权重值默认为1。如果权重值被配置为0,则表示该应用/设备将不参与业务得分的计算。
在业务监视列表中,点击待配置业务对应的“权重分配”图标,进入业务权重分配页面。
(1) 配置业务大类权重值
用于对业务服务主机、业务应用、网络设备大类参与业务可用度得分/业务健康度得分/业务繁忙度得分计算的权重分配。
a. 配置可用度权重:
¡ 服务主机:设置服务主机大类参与业务可用度得分计算的权重值。
¡ 业务应用:设置业务应用大类参与业务可用度得分计算的权重值。
¡ 网络设备:设置网络设备大类参与业务可用度得分计算的权重值。
b. 配置健康度权重:
¡ 服务主机:设置服务主机大类参与业务健康度得分计算的权重值。
¡ 业务应用:设置业务应用大类参与业务健康度得分计算的权重值。
¡ 网络设备:设置网络设备大类参与业务健康度得分计算的权重值。
c. 配置繁忙度权重:
¡ 服务主机:设置服务主机大类参与业务繁忙度得分计算的权重值。
¡ 业务应用:设置业务应用大类参与业务繁忙度得分计算的权重值。
¡ 网络设备:设置网络设备大类参与业务繁忙度得分计算的权重值。
d. 配置完成后,分别单击各大类输入框后<确定>按钮保存配置。
点击图标折叠业务大类权重分配。点击图标展开业务大类权重分配。
(2) 配置各大类下具体节点的权重值
可以通过点击“服务主机”、“业务应用”和“网络设备”页签在服务主机权重分配列表、业务应用权重分配列表和网络设备权重分配列表间切换。
a. 点击列表中待修改服务主机/业务应用/网络设备的操作列图标,该记录的可用度权重值、健康度权重值、繁忙度权重值及是否为业务核心元素列变为可编辑状态。
b. 配置如下参数:
¡ 可用度权重:设置服务主机/业务应用/网络设备的可用度权重值。
¡ 健康度权重:设置服务主机/业务应用/网络设备的健康度权重值。
¡ 繁忙度权重:设置服务主机/业务应用/网络设备的繁忙度权重值。
¡ 是否为业务核心元素:选择服务主机/业务应用/网络设备是否为业务的核心元素,包括核心元素和非核心元素。业务应用默认为核心元素。如果业务核心元素达到不可用状态时,整个业务不可用,业务得分全部为0。如果业务核心元素运行状态正常,则一切按照正常规则进行计算。
¡ 单击<确定>按钮,完成修改。
¡ 配置完成后,单击<返回>按钮,返回至业务监视页面。
对于不同的业务,通常会由多名不同身份和角色的管理员进行管理。U-Center操作员在对业务进行分组时可以将分组的管理权限指定给不同的管理员,从而实现对业务的分权管理。
“未分组”为系统缺省的业务分组,不能对其进行修改和删除。新增和未被分组的业务都属于“未分组”,所有操作员对“未分组”中的业务具有管理权限。业务分组如图7-1所示。
(1) 点击“业务服务”页签,在左导航中选择“业务管理 > 业务分组”菜单项,进入业务分组页面。
(2) 列表中各列的说明如下:
· 名称:业务分组的名称。
· 业务数量:业务的个数。
· 详细信息:点击“详细信息”图标查看该分组的详细信息。
· 修改:点击“修改”图标修改对应业务分组。
· 删除:点击“删除”图标删除对应业务分组。
(3) 列表上方功能栏中各功能的说明如下:
· 增加:增加新的业务分组。
· 刷新:刷新并获得最新业务分组列表。
(1) 在业务分组列表中点击业务分组对应的“详细信息”图标,进入该业务分组详细信息页面。
包含如下内容:
· 名称:业务分组的名称。
· 描述:业务分组的描述信息。
· 操作员分组:操作员分组的名称。分组中的操作员具有该业务分组的管理权限。
· 业务列表:业务分组中所包含的业务。
(2) 单击<返回>按钮,返回业务分组页面。
(1) 在业务分组页面,单击<增加>按钮,进入增加业务分组页面。
(2) 输入业务分组的名称。名称必须唯一,且名称长度不能超过64个字符。
(3) 输入业务分组的描述信息。
(4) 选择可以管理本分组中业务的操作员分组。
· 增加操作员分组
a. 单击“操作员分组”文本框右侧的<增加>按钮,弹出“选择操作员分组”窗口。
b. 选择一个或多个操作员分组。
c. 单击<确定>按钮,增加的操作员分组显示在“操作员分组”文本框中。
· 删除操作员分组
a. 在“操作员分组”文本框选择一个或多个操作员分组。
b. 单击<删除>按钮,删除选择的操作员分组。
(5) 选择分组中的业务。
· 增加业务
a. 单击“业务列表”文本框右侧的<增加>按钮,弹出“选择业务”窗口。
b. 选择一个或多个业务。如果业务列表中业务较多,可通过在列表上方的查询框中输入业务名称进行筛选。
c. 单击<确定>按钮,增加的业务显示在“业务列表”文本框中。
· 删除业务
a. 在“业务列表”文本框选择一个或多个业务。
b. 单击<删除>按钮,删除选择的业务。
(6) 单击<确定>按钮,完成增加业务分组。
删除业务分组后,该分组中未加入其他业务分组的业务会被自动加入“未分组”。
在业务分组列表中,点击待删除业务分组对应的“删除”图标,弹出确认对话框。单击<确定>按钮,删除该业务分组。
(1) 在业务分组列表中,点击待修改业务分组对应“修改”图标,进入修改业务分组页面。
(2) 修改业务分组的参数。修改完成后,单击<确定>按钮。
BSM根据指定源端与目的端,绘制出两者之间的网络拓扑,即业务端到端拓扑。当某一用户无法访问业务时,通过查看业务端到端拓扑,可以了解源端到目的端之间节点的链路状态,使管理员准确定位到故障根源。
(1) 点击“业务服务”页签,在左导航中选择“业务管理 > 业务端到端拓扑”菜单项,进入业务端到端拓扑页面。
(2) 在“源端”文本框中输入源端IP地址。
(3) 单击“目的端”文本框右侧的<选择>按钮,弹出“选择目的终端”窗口,在目的终端列表中,选择某一业务或者业务下某一服务主机,单击<确定>按钮。
(4) 单击<打开拓扑>按钮,查看该业务端到端拓扑。
业务端到端拓扑展示指定源端到目的端之间所有路径的网络拓扑。只有源端到目的端路径上的每个节点设备都处于U-Center的管理中,才会显示完整的路径。
拓扑结构中图例说明如表8-1所示。
图标 |
名称 |
说明 |
|
源端 |
· 当源端为U-Center管理的设备时,显示源端IP地址,并在拓扑中显示该设备。 · 当源端未在U-Center中管理时,显示源端IP地址,并在拓扑中显示其接入设备。 |
|
PC |
该图标表示已知源端设备为PC,颜色代表PC的状态。 |
|
服务主机 |
服务主机上的图标代表了操作系统的类型,该图标表示服务主机上运行了Windows操作系统。 |
|
业务应用 |
不同类型的业务应用都有其对应的图标,该图标表示这是一个Oracle数据库。 |
|
告警 |
设备存在未恢复的告警时,右上角会显示当前的告警数量,背景颜色代表当前最高的告警等级。 |
|
网络设备 |
设备颜色代表网络设备的状态。 |
|
物理网络 |
网络设备所连接的网络,表示存在未加入U-Center管理的节点。 |
网络连接 |
实线表示直接连接,虚线表示间接连接,颜色代表链路状态。 |
拓扑基本功能如表8-2所示。
功能 |
说明 |
|
点击该图标将鼠标指针置于选择状态,操作员可以在拓扑中选择、拖拽节点。打开拓扑时,鼠标指针默认为选择状态。 |
|
点击该图标将鼠标指针置于放大镜状态,在拓扑窗口中移动鼠标可以对拓扑进行局部放大。 |
|
点击该图标将拓扑放大。 |
|
点击该图标将拓扑缩小。 |
|
点击该图标将拓扑重置为原始大小。 |
|
点击该图标将拓扑根据窗口大小进行调整,使其全部显示在窗口中。 |
|
点击该图标生成当前拓扑的快照图片。 |
|
点击该图标更新拓扑的布局。 |
· 右键菜单:只有业务中的服务主机或业务应用支持右键菜单。
¡ 选择“应用监视”菜单项,查看服务主机操作系统或业务应用的监视报表。
¡ 选择“依赖拓扑”菜单项,查看服务主机操作系统或业务应用的依赖拓扑。依赖拓扑是以该服务主机或业务应用的为中心,展示所有与其直接依赖或间接依赖的应用。
¡ 选择“查询告警”菜单项,U-Center主页面显示该服务主机或业务应用相关的所有告警。只有存在未恢复告警的服务主机或业务应用的才有该菜单项。
· 鼠标移至服务主机/业务应用/网络设备图标上可以查看其详细信息。
配置管理用于配置BSM业务参数,管理业务中基础设施的联系人,以及为业务中基础设施定制维护计划。配置管理包括参数设置、联系人列表和维护计划。
点击“业务服务”页签,在左导航中选择“业务管理 > 配置管理”菜单项,进入配置管理页面。
参数配置用于配置业务服务管理组件的数据保存时长,系统根据配置的保存时长定期清理超过时限的历史数据。
(1) 在配置管理页面,点击“参数设置”链接,进入参数设置页面。
(2) 配置原始数据保存时长。
(3) 输入原始数据的保存时长,范围是1-60天,默认为30天。
(4) 单击参数右侧的<确定>按钮使配置的参数生效。
(5) 配置小时数据保存时长。BSM将原始数据聚合为小时数据。当查询历史数据时,以小时为单位。输入小时数据的保存时长,范围是1-6个月,默认为2个月。
(6) 单击参数右侧的<确定>按钮使配置的参数生效。
(7) 配置天数据保存时长。BSM将原始数据聚合为天数据。当查询历史数据时,以天为单位。输入天数据的保存时长,范围是1-24个月,默认为2个月。
(8) 单击参数右侧的<确定>按钮使配置的参数生效。
(9) 单击<返回>按钮,返回至配置管理页面。
联系人管理用于对业务中基础设施的联系人进行集中管理。管理功能包括增加和修改服务主机/业务应用/网络设备的联系人信息。
(1) 在配置管理页面,点击“联系人列表”链接,进入联系人列表页面。点击标签页在服务主机、业务应用与网络设备间切换,分别显示业务管理系统中所有的服务主机、业务应用及网络设备列表。
(2) 点击列表中待修改服务主机/业务应用/网络设备的操作列图标,该记录的联系人和联系方式列变为可编辑状态,增加或修改服务主机/业务应用/网络设备的联系人信息。
(3) 配置如下参数:
· 联系人:增加或修改服务主机/业务应用/网络设备的联系人。
· 联系方式:增加或修改服务主机/业务应用/网络设备联系人的联系方式。
(4) 点击图标,确认修改。或者点击图标,放弃对该记录的修改。
维护计划是针对业务中服务主机、业务应用以及网络设备进行硬件、系统等方面的维护时制定的计划。在维护计划时间内,服务主机/业务应用/网络设备的所有指标值都将以最优值参与业务健康度、繁忙度和可用度得分的计算。通过定制维护计划,可以避免正常维护的设备/应用对业务得分计算产生影响。
在配置管理页面,点击“维护计划”链接,进入维护计划页面。点击标签页在服务主机、业务应用与网络设备间切换,分别显示业务管理系统中所有的服务主机、业务应用及网络设备。
页面中功能介绍如下:
· 查询功能
当列表中服务主机/业务应用/网络设备较多时,可通过在列表上方的查询框中输入名称进行筛选。
· 功能按钮说明
定制:单击<定制>按钮,批量定制维护计划。
提前结束:勾选一个或多个服务主机/业务应用/网络设备,单击<提前结束>按钮,批量提前结束其已定制的维护计划,包括已开始未结束以及未开始的维护计划。
· 列表包含如下内容
¡ 应用/设备名称:服务主机/业务应用/网络设备的名称。
¡ 是否已有维护计划:是否已为服务主机/业务应用/网络设备定制了维护计划。
¡ 操作:点击“定制”链接,查看服务主机/业务应用/网络设备维护计划详情。
在维护计划页面,点击列表中操作列的“定制”链接,进入服务主机/业务应用/网络设备维护计划详情页面。
单击<刷新>按钮,刷新页面展示最新的数据。
维护计划详情包含如下内容:
· 应用/设备名称:服务主机/业务应用/网络设备的名称。
· 关联业务:服务主机/业务应用/网络设备所在的业务。
· 已有维护计划:显示服务主机/业务应用/网络设备已定制的维护计划信息。
已有维护计划列表包含如下内容:
¡ 创建人:定制该维护计划的操作员。
¡ 创建时间:该维护计划创建的时间。
¡ 开始时间:该维护计划开始执行的时间。
¡ 结束时间:该维护计划结束的时间。
¡ 描述:该维护计划的描述信息。
¡ 操作:对该维护计划可执行的操作。对于已经结束的维护计划,操作列显示为空。
- 取消:点击“取消”链接,取消已定制的维护计划。仅未开始的维护计划可以取消,计划取消后,该条记录消失。
- 提前结束:点击“提前结束”链接,提前结束已开始且没有结束的维护计划。
列表上方功能按钮说明:
¡ 定制:单击<定制>按钮,为单个服务主机/业务应用/网络设备定制维护计划。
¡ 提前结束:勾选一个或多个维护计划,单击<提前结束>按钮,批量提前结束所选维护计划,包括已开始未结束的维护计划和未开始的维护计划。
数据中心管理用于管理数据中心,监视数据中心的各项性能指标。通过对数据中心中宿主机和物理服务器的监视,BSM可以生成报告,帮助管理员了解数据中心的运行状况。如图10-1所示。
查看数据中心列表的方法如下:
点击“业务服务”页签,在左导航中选择“数据中心管理 > 数据中心管理”菜单项,进入数据中心管理页面。
列表中各列的说明如下:
· 名称:数据中心的名称。点击数据中心名称链接可以查看该数据中心的信息。
· 报告:点击“报告”图标查看该数据中心的报告。
· 描述:数据中心的描述信息。
· 联系人:数据中心的联系人。
· 修改:点击“修改”图标修改对应数据中心。
· 删除:点击“删除”图标删除对应数据中心。
列表上方功能栏中各功能的说明如下:
· 增加:增加新的数据中心。
· 刷新:刷新并获得最新的数据中心信息。
· 删除:删除一个或多个数据中心。
(1) 在数据中心管理页面,点击列表中数据中心对应的名称链接,进入数据中心信息页面。
数据中心信息包含如下内容:
· 名称:数据中心的名称。
· 描述:数据中心的描述信息。
· 联系人:负责数据中心的联系人。
· 物理服务器:数据中心包含的物理服务器。
· 宿主机:数据中心包含的宿主机。
(2) 单击<返回>按钮,返回数据中心管理页面。
(1) 在数据中心管理页面,单击<增加>按钮,进入增加数据中心页面。
(2) 输入数据中心的名称。名称必须唯一,且长度不能超过32个字符。
(3) 输入数据中心的描述信息。
(4) 输入数据中心的联系人。默认为当前登录的操作员。
(5) 选择物理服务器。该处选择的物理服务器对应APM中操作系统类型的应用监视,例如Windows应用、AIX应用、Linux应用等。
· 增加物理服务器
¡ 单击“物理服务器”文本框右侧的<增加>按钮,弹出“选择应用”窗口。
¡ 选中一个或多个服务器应用。如果列表中服务器应用较多,可通过在列表上方的查询框中输入服务器应用名称进行筛选。
¡ 单击<确定>按钮,增加的服务器应用显示在“物理服务器”文本框中。
· 删除物理服务器
¡ 在“物理服务器”文本框选择一个或多个服务器应用。
¡ 单击<删除>按钮,删除选择的服务器应用。
(6) 选择宿主机。宿主机指运行虚拟化管理软件的服务器,例如VMware ESX、Hyper-V、CAS等。
· 增加宿主机
¡ 单击“宿主机”文本框右侧的<增加>按钮,弹出“选择宿主机”窗口。
¡ 选中一个或多个宿主机。如果列表中宿主机较多,可通过在列表上方的查询框中输入宿主机名称进行筛选。
¡ 单击<确定>按钮,增加的宿主机显示在“宿主机”文本框中。
· 删除宿主机
¡ 在“宿主机”文本框选择一个或多个宿主机。
¡ 单击<删除>按钮,删除选择的宿主机。
(7) 单击<确定>按钮,完成增加数据中心。
数据中心管理提供了单个删除和批量删除数据中心两种方式。删除数据中心将会删除该数据中心的所有数据,后续再次增加相同名称的数据中心不会恢复已删除的数据。
(1) 删除单个数据中心
在数据中心列表中,点击待删除数据中心对应的“删除”图标,弹出确认对话框。单击<确定>按钮,删除该数据中心。
(2) 批量删除数据中心
a. 在数据中心列表中,选择一个或多个待删除的数据中心。
b. 单击<删除>按钮,弹出确认对话框。单击<确定>按钮,删除所选的数据中心。
(1) 在数据中心列表中,点击待修改数据中心对应的“修改”图标,进入修改数据中心页面。
(2) 修改数据中心的参数。修改完成后,单击<确定>按钮。
数据中心鸟瞰图展现数据中心的运行情况,以及数据中心、集群、主机、虚拟机的层级关系,并提供查看数据中心报告、集群报告和主机报告的功能。通过各级报告提供的详细性能信息及容量预测,管理员可以及时调整主机配置,以避免数据中心性能瓶颈。数据中心鸟瞰图如图11-1所示。
本节按照数据中心的层级关系对数据中心、集群、主机和虚拟机逐一进行介绍。
点击“业务服务”页签,在左导航中选择“数据中心管理 > 数据中心鸟瞰图”菜单项,进入数据中心鸟瞰图页面。
数据中心鸟瞰图页面每5分钟自动刷新一次。
展示所有被管理的数据中心。
· 鼠标移至某一数据中心的图标上,高亮显示该数据中心,同时显示该数据中心的名称。
· 点击某一数据中心图标,高亮显示该数据中心以及数据中心所包含的集群、主机和虚拟机,同时弹出<报告>按钮。单击<报告>按钮可查看该数据中心的报告。
展示数据中心包含的所有集群。正确获取集群信息请确保宿主机的vManager已纳入U-Center中管理。
· 鼠标移至某一集群的图标上,高亮显示该集群,同时显示该集群的名称。
· 点击某一集群图标,高亮显示该集群,同时弹出<报告>按钮。单击<报告>按钮,可查看该集群的报告。
展示数据中心包含的所有主机及其状态,主机包括宿主机和物理服务器。
(1) 宿主机
宿主机指运行虚拟化管理软件的服务器。宿主机图标的颜色表示其运行状态,对应U-Center设备的运行状态。宿主机类型以及图标介绍如表11-1所示。
· 鼠标移至某一宿主机的图标上,高亮显示该宿主机,同时显示该宿主机的名称。
· 点击某一宿主机图标,高亮显示该宿主机以该宿主机所包含虚拟机,同时弹出<报告>按钮。单击<报告>按钮可查看该宿主机的报告。
图标 |
宿主机类型 |
VMware ESX/ESXi |
|
Hyper-V |
|
KVM |
|
XenServer |
|
CAS |
(2) 物理服务器
物理服务器指APM中操作系统类型应用监视的服务器。物理服务器图标的颜色对应APM中应用的健康状况。物理服务器类型以及图标介绍如表11-2所示。
· 鼠标移至某一物理服务器的图标上,高亮显示该物理服务器,同时显示该物理服务器的名称。
· 点击某一物理服务器图标,高亮显示该物理服务器,同时弹出<报告>按钮。单击<报告>按钮可查看该物理服务器的监视报表。
图标 |
服务器操作系统类型 |
Windows |
|
Linux |
|
AIX |
|
FreeBSD |
|
OpenBSD |
|
HP-UX |
|
SCO Unix |
|
Solaris |
|
Mac OS |
展示数据中心所包含的所有虚拟机及其状态。虚拟机的状态分为运行中和已关闭。
· 鼠标移至某一虚拟机的图标上,高亮显示该虚拟机,同时显示该虚拟机的名称。
· 点击某一虚拟机图标,高亮显示该虚拟机,同时显示该虚拟机的性能指标。已关闭的虚拟机不能查看其性能指标。
虚拟机性能指标展示内容如下:CPU利用率、内存利用率、磁盘读速率、磁盘写速率、网络接收速率、网络发送速率。
虚拟机根据不同的性能指标进行排序,可以帮助管理员快速了解所关注指标的Top10虚拟机。
点击数据中心鸟瞰图页面右上角的图标,弹出Top10虚拟机列表窗口,默认以CPU利用率进行降序排列。分别点击性能指标列名可以按该指标进行降序排列。
虚拟机Top10列表展示内容如下:名称、CPU利用率、内存利用率、磁盘I/O、网络I/O。
“数据中心鸟瞰图”页面可以切换至“业务概览”页面或“业务数据窗”页面。切换方法如下:
(1) 将鼠标移至页面顶部,弹出界面切换面板。
(2) 在切换面板中,选择窗口显示的页面,可选页面包括业务概览、业务数据窗和数据中心鸟瞰图。
数据中心报告展示数据中心的组成情况、集群信息和主机性能统计信息。该功能可以帮助管理员了解该数据中心的整体运行情况。
打开数据中心报告有如下两种方法:
· 在数据中心管理页面,点击某一数据中心的“报告”图标,打开该数据中心报告。
· 在数据中心鸟瞰图页面,点击某一数据中心图标,再单击<报告>按钮,打开该数据中心报告。
数据中心详细信息展示了该数据中心的名称、描述和联系人以及成员信息,包括集群、宿主机、物理服务器和虚拟机的数量。
展示该数据中心所包含的集群及各集群内处于正常、存在告警和未知状态的宿主机数量。点击集群名称链接,跳转至该集群的报告窗口,查看该集群的详细运行情况,点击图标,返回至数据中心报告窗口。
宿主机状态说明如下:
· 正常:显示为绿色图标。后方数字表示当前正常运行的宿主机的数量。
· 存在告警:显示为红色图标。后方数字表示当前存在严重、重要、次要或警告级别告警的宿主机的数量。
· 未知:显示为浅蓝色图标。后方数字表示当前未知状态的宿主机的数量。
展示该数据中心所包含宿主机的性能信息,反映出数据中心所有宿主机当前整体的运行情况。
通过不同颜色的环状比例图和比例值展示所有宿主机的平均CPU/内存/磁盘利用率。其中,蓝色表示CPU平均利用率;黄色表示内存平均利用率;绿色表示磁盘平均利用率。
比例图下方的<CPU利用率>、<内存利用率>和<磁盘利用率>按钮用于切换显示当前CPU、内存或磁盘利用率最高的前5台宿主机。
展示该数据中心中所包含物理服务器的性能信息,反映出数据中心所有物理服务器当前整体的运行情况。
通过不同颜色的环状比例图和比例值展示所有物理服务器的平均CPU/内存/磁盘利用率。其中,蓝色表示CPU平均利用率;黄色表示内存平均利用率;绿色表示磁盘平均利用率。
比例图下方的<CPU利用率>、<内存利用率>和<磁盘利用率>按钮用于切换显示当前CPU、内存或磁盘利用率最高的前5台物理服务器。
集群报告展示集群的容量概况、集群信息和宿主机性能统计,容量负载情况以及容量预测信息。该功能可以帮助管理员定位集群性能瓶颈,并提供容量预警及扩容建议。
在数据中心鸟瞰图页面,点击某一集群图标,再单击<报告>按钮,打开该集群报告。
容量概况展示集群中所有宿主机容量使用情况,包括CPU/内存/磁盘的总容量及已使用的CPU/内存/磁盘情况。
集群信息展示如下信息:
· 主机数量:该集群中包含宿主机的数量。
· 虚拟机数量:该集群中包含虚拟机的数量。
· 虚拟机密度:该集群的虚拟机密度。虚拟机密度=虚拟机数量/宿主机数量。
展示集群中宿主机的性能统计数据。可以帮助管理员了解需要关注的宿主机数量和比例。
· 关闭的主机:展示当前处于关闭状态的宿主机数量,以及占宿主机总数的百分比。关闭的主机指无法访问的宿主机。点击图标,展示当前处于关闭状态的宿主机列表。
· 闲置的主机:展示当前处于闲置状态的宿主机数量,以及占宿主机总数的百分比。闲置的主机指CPU利用率且内存利用率低于10%的宿主机。点击图标,展示当前处于闲置状态的宿主机列表,以及宿主机的CPU利用率和内存利用率。
· 容量不足的主机:展示当前处于容量不足状态的宿主机数量,以及占宿主机总数的百分比。容量不足的主机指CPU利用率及内存利用率大于85%的宿主机。点击图标,展示当前处于容量不足状态的宿主机列表,以及宿主机的CPU利用率和内存利用率。
从CPU负载、内存负载及磁盘负载三个方面展示集群中所有宿主机的容量利用率、超配比信息以及容量预测信息。
· 容量利用率:根据最近一次轮询获取的性能数据了解容量利用率情况。
¡ 利用率:集群中所有宿主机CPU/内存/磁盘的平均利用率。没有采集到数据和已关闭的宿主机不参与计算。
¡ 利用率波动:集群中所有宿主机CPU/内存/磁盘利用率波动值。利用率波动指同一采样点利用率最大值与最小值之间的差值。没有采集到数据和已关闭的宿主机不参与计算。
· 超配比信息:展示集群的超配比信息。
¡ CPU/内存/磁盘预设超配比:显示集群预设的CPU/内存/磁盘超配比。当实际超配比超过预设超配比值时提示风险警告信息。点击图标,修改CPU/内存/磁盘预设超配比。
¡ VM平均分配CPU/内存/磁盘:显示集群中所有虚拟机平均分配的CPU/内存/磁盘。
¡ 超配比:显示当前集群CPU/内存/磁盘的超配比。超配比即集群中所有的虚拟机的CPU/内存/磁盘容量之和与集群所有宿主机CPU/内存/磁盘总容量的比值。
· 容量预测:展示最近15天内CPU/内存/磁盘利用率上升最快的Top3宿主机的趋势图,并预测其达到100%的时间。将鼠标移至曲线上可以看到各采样点具体信息。
¡ 点击图例名称可在趋势图中显示/隐藏监控指标及容量趋势。
¡ CPU/内存/磁盘利用率风险预测列表中,点击宿主机名称链接,CPU/内存/磁盘风险预测趋势图显示该宿主机的趋势图。
宿主机报告展示容量概况、宿主机信息、宿主机性能统计、宿主机超配比信息、容量负载情况以及容量预测信息。该功能可以帮助管理员定位宿主机性能瓶颈,并提供容量预警及扩容建议。
在数据中心鸟瞰图页面,点击某一宿主机的图标,再单击<报告>按钮,打开该宿主机报告。
容量概况展示宿主机容量使用情况,包括CPU/内存/磁盘的总容量及已使用的CPU/内存/磁盘情况。
主机信息展示如下信息:
· 集群:显示该宿主机所在集群的名称。
· 虚拟机数量:显示该宿主机中虚拟机的总数量。
展示宿主机中虚拟机的性能统计数据。可以帮助管理员了解需要关注的虚拟机数量和比例。
· 关闭的VM:展示当前处于关闭状态的虚拟机数量,以及占虚拟机总数的百分比。关闭的VM指无法访问的虚拟机。点击图标,展示当前处于关闭状态的虚拟机列表。
· 闲置的VM:展示当前处于闲置状态的虚拟机数量,以及占虚拟机总数的百分比。闲置的VM指CPU利用率且内存利用率低于10%的虚拟机。点击图标,展示当前处于闲置状态的虚拟机列表,以及虚拟机的CPU利用率和内存利用率。
· 容量不足的VM:展示当前处于容量不足状态的虚拟机数量,以及占虚拟机总数的百分比。容量不足的VM指CPU利用率及内存利用率大于85%的虚拟机。点击图标,展示当前处于容量不足状态的虚拟机列表,以及虚拟机的CPU利用率和内存利用率。
展示CPU/内存/磁盘超配比信息,帮助管理员判断宿主机资源的分配概况。
· CPU/内存/磁盘预设超配比:显示宿主机预设的CPU/内存/磁盘超配比。当实际超配比超过预设超配比值时提示风险警告信息。点击图标,修改CPU/内存/磁盘预设超配比。
· VM平均分配CPU/内存/磁盘:显示宿主机中所有虚拟机平均分配的CPU/内存/磁盘。
· 超配比:显示当前宿主机CPU/内存/磁盘的超配比。超配比即宿主机中所有虚拟机的CPU/内存/磁盘容量之和与宿主机CPU/内存/磁盘总容量的比值。
从CPU负载和内存负载两个方面展示所有虚拟机的容量利用率和容量预测信息。
· 容量利用率:根据最近一次轮询获取的性能数据了解容量利用率情况。
¡ 利用率:宿主机中所有虚拟机CPU/内存平均利用率。没有采集到数据或已关闭的虚拟机不参与计算。
¡ 利用率波动:宿主机中所有虚拟机CPU/内存利用率波动值。利用率波动指同一采样点利用率最大值与最小值之间的差值。没有采集到数据或已关闭的虚拟机不参与计算。
· 容量预测:展示最近15天内CPU/内存利用率上升最快的Top3虚拟机的趋势图,并预测其达到100%的时间。将鼠标移至曲线上可以看到各采样点具体信息。
¡ 点击图例名称可在趋势图中显示/隐藏监控指标及容量趋势。
¡ CPU/内存利用率风险预测列表中,点击虚拟机名称链接,CPU/内存风险预测趋势图显示该虚拟机的趋势图。
物理服务器通过APM进行监视,使用APM的应用监视报表作为物理服务器报告,如图11-2所示。
巡检任务在指定时间对任务中的应用进行巡检,根据应用已有的巡检采集项采集指标数据,匹配采集项规则分析采集结果,判断是否符合要求,并生成巡检报告。巡检任务管理提供了增加、修改、删除和立即执行巡检任务,查看巡检历史等功能,便于管理员集中管理巡检任务。
(1) 点击“业务服务”页签,在左导航中选择“巡检管理 > 巡检任务管理”菜单项,进入巡检任务管理页面。
(2) 列表中各列的说明如下:
· 任务名称:巡检任务的名称。点击任务名称链接可以查看该巡检任务详细信息。
· 任务描述:巡检任务的描述信息。
· 调度类型:巡检任务的调度类型,包括立即执行和周期执行。
· 调度周期:定期执行巡检任务的周期,包括每天、每周、每月和无。调度类型为立即执行的巡检任务,调度周期则为“无”。
· 开始时间:巡检任务最近一次开始执行的时间。未开始执行的巡检任务则显示为“暂无数据”。
· 执行结果:巡检任务最近一次执行的结果,包括正在巡检、已完成和暂无数据。未开始执行的巡检任务则显示为“暂无数据”。
· 创建人:创建巡检任务的操作员。
· 修改:点击“修改”图标,修改对应的巡检任务。
· 删除:点击“删除”图标,删除对应的巡检任务。
· 历史:点击“历史”图标,查看该巡检任务的巡检历史。
(3) 列表上方功能栏中各功能的说明如下:
· 增加:增加新的巡检任务。
· 刷新:刷新并获得最新的巡检数据。
· 删除:删除一个或多个巡检任务。
· 立即执行:立即对所选任务执行巡检。
(1) 在巡检任务列表中点击巡检任务对应的名称链接,进入巡检任务详细信息页面。
巡检任务详细信息包含如下内容:
· 任务名称:巡检任务的名称。
· 调度类型:巡检任务的调度类型。
· 调度周期:定期执行巡检任务的周期。当调度类型为周期执行的巡检任务展示该项。
· 任务描述:巡检任务的描述信息。
· 应用列表:以列表的形式展示了该巡检任务中所有待检查应用的基本信息,包括名称、IP地址和联系人。
(2) 单击<返回>按钮,返回巡检任务管理页面。
(1) 在巡检任务管理页面,单击<增加>按钮,进入增加巡检任务页面。
(2) 输入巡检任务的名称。名称必须唯一,且名称长度不能超过32个字符。
(3) 选择巡检任务的调度类型,包括立即执行和周期执行。
· 立即执行:在创建巡检任务完成后手动立即执行该任务。
· 周期执行:按指定的周期和时间定期执行该任务。选择该选项时还需要配置调度周期,即每天/每周周X/每月X日的hh:mm。
(4) 输入巡检任务的描述信息。
(5) 选择巡检任务待采集的应用。待选应用为U-Center已监视的应用。
· 增加应用
a. 单击<增加>按钮,弹出“选择应用”窗口。
b. 选择一个或多个应用。
c. 单击<确定>按钮,增加的应用显示在列表中。
· 删除应用
a. 在应用列表中选择一个或多个应用。
b. 单击<删除>按钮,删除选择的应用。
(6) 单击<确定>按钮,完成增加巡检任务。
巡检任务管理提供了单个删除和批量删除巡检任务两种方式。删除巡检任务将会删除该巡检任务的所有数据,后续再次增加相同名称的巡检任务不会恢复已删除的数据。
(1) 删除单个巡检任务
在巡检任务列表中,点击待删除巡检任务对应的“删除”图标,弹出确认对话框。单击<确定>按钮,删除该巡检任务。
(2) 批量删除巡检任务
a. 在巡检任务列表中,选择一个或多个待删除巡检任务。
b. 单击<删除>按钮,弹出确认对话框。单击<确定>按钮,删除所选巡检任务。
(1) 在巡检任务列表中,点击待修改巡检任务对应“修改”图标,进入修改巡检任务页面。
(2) 修改巡检任务的参数。修改完成后,单击<确定>按钮。
(1) 在巡检任务列表右上角的查询框中输入巡检任务的名称。任务名称支持模糊匹配。
(2) 点击即可完成查询,查询结果显示在巡检任务列表中。
巡检历史以任务为单位展示了巡检任务的执行历史记录,同时还提供了查看和下载巡检报告的功能。
(1) 在巡检任务列表中,点击待查看历史的巡检任务对应“历史”图标,进入巡检历史页面。
(2) 巡检历史列表每一行显示了该巡检任务的一次执行记录。列表中各列的说明如下:
· 任务名称:巡检任务的名称。
· 任务描述:巡检任务的描述信息。
· 开始时间:执行该巡检任务的开始时间。
· 结束时间:执行该巡检任务的结束时间。
· 执行结果:巡检任务的该次执行结果。
· 巡检报告:单击<下载>按钮,可以下载该次执行巡检任务生成的报告。
· 查看:单击<查看>按钮,可以查看该次执行巡检任务生成的报告。
(3) 列表上方功能栏中各功能的说明如下:
· 刷新:刷新并获得最新的巡检历史数据。
· 删除:删除一个或多个所选的巡检历史。
巡检任务生成的巡检报告中展示了巡检采集结果,并罗列了违规项。
(1) 巡检任务汇总报告
a. 在巡检任务列表中,点击待查看历史的巡检任务对应“历史”图标,进入巡检历史页面。
b. 在巡检历史列表中,单击待查看巡检报告对应的<查看>按钮,弹出巡检报告。
c. 巡检报告中包含如下内容:
· 任务基本信息:巡检任务中包含的应用类型及各应用实例的数量。
· 巡检任务信息汇总:巡检任务报告的汇总信息。
¡ 任务名称:巡检任务的名称。
¡ 任务描述:巡检任务的描述信息。
¡ 调度类型:巡检任务的调度类型。调度类型为“周期执行”时,展示其调度周期时间。
¡ 开始时间:执行该次巡检任务开始的时间。
¡ 结束时间:执行该次巡检任务结束的时间。
¡ 巡检耗时:执行该次巡检任务的所耗时间。
· 汇总结果:展示了每个应用的可用性和采集项通过/总数的巡检结果。
¡ 应用:应用的名称。点击应用的名称链接,弹出该应用的巡检报告。
¡ 可用性:应用的可用性状态。
¡ 通过/总数:通过巡检的采集项个数/巡检采集项总数。应用存在违规采集项时,其背景为红色。
· 未通过采集项统计:以应用类型为单位,统计巡检任务中所有应用未通过的采集项及信息,包括采集项名称、改进意见、规则内容和未通过的应用列表。
应用巡检报告展示了应用的巡检结果,包括应用的可用性,巡检采集项和采集数据、以及巡检是否通过、改进意见等信息。对于配置了改进意见且未通过巡检的采集项,显示其改进意见。
a. 在巡检任务列表中,点击待查看历史的巡检任务对应“历史”图标,进入巡检历史页面。
b. 在巡检历史列表中,单击待查看巡检报告对应的<查看>按钮,弹出巡检报告。
c. 在汇总结果列表中,点击待查看巡检报告应用对应的名称链接,弹出该应用巡检结果报告。
(1) 在巡检历史列表中,选择一个或多个待删除巡检任务历史。
(2) 单击<删除>按钮,弹出确认对话框。单击<确定>按钮,删除所选的巡检历史。删除巡检历史会删除该次执行巡检任务的记录及巡检报告,不会删除对应的巡检任务。
巡检采集项是巡检任务的基础,执行巡检任务时,系统根据应用类型所对应的采集项采集指标数据。采集项定义了采集应用指标数据需要执行的命令,对采集结果进行分析的规则以及生成报告的改进意见等信息。
BSM中预置了一些常用的应用指标。用户也可根据实际需求增加巡检采集项,包括预定义应用指标和自定义应用指标。
· 预定义应用指标:从APM中选取其他的应用指标作为巡检采集项。
· 自定义应用指标:使用自定义命令作为应用指标。用户可根据需巡检的内容自定义命令作为巡检采集项。
(1) 点击“业务服务”页签,在左导航中选择“巡检管理 > 巡检采集项”菜单项,进入巡检采集项页面。
(2) 列表中各列的说明如下:
· 应用类型:应用的类型。点击应用类型名称链接可以查看该应用类型所有的采集项。
· 采集项名称:巡检采集项的名称。点击采集项名称链接可以查看该巡检采集项详细信息。
· 命令:采集该项数据时需要在应用上执行的命令。仅自定义应用指标显示命令内容。
· 描述:采集项的描述信息。
· 采集项类型:采集项的类型,包括自定义应用指标和预定义应用指标。
· 规则数量:采集项中包含的规则数量。
· 修改:点击“修改”图标,修改巡检采集项。
(3) 列表上方功能栏中各功能的说明如下:
· 增加:增加新的巡检采集项。
· 刷新:刷新并获得最新的巡检采集项数据。
· 删除:删除一个或多个巡检采集项。
· 重置:重置已过滤的巡检采集项列表。
(1) 在巡检采集项列表中点击采集项名称链接,进入巡检采集项详细信息页面。
巡检采集项详细信息包含如下内容:
· 采集项类型:采集项的类型,包括自定义应用指标和预定义应用指标。
· 应用类型:应用的类型。
· 警告级别:采集数据不符合要求时产生警告的级别。
· 采集项名称:采集项的名称。
· 命令类型:采集指标数据的命令类型。
· 命令:采集指标数据时需要执行的命令。
· 检查要求:分析采集数据的标准。
· 改进意见:分析结果为不通过时,在巡检报告中提示用户改进的建议。
· 描述:采集项的描述信息。
· 规则类别:分析该采集项时的规则类别,包括匹配规则和直接回显。其中如果规则类别为匹配规则时,下方会显示相应的匹配规则信息。
(2) 单击<返回>按钮,返回巡检任务管理页面。
(1) 在巡检采集项列表中,单击<增加>按钮,进入增加巡检采集项页面。
(2) 配置采集项参数:
· 采集项类型:选择巡检采集项的类型,包括自定义应用指标和预定义应用指标。
如选择“自定义应用指标”类型,需配置“命令类型”和“命令”配置项。
· 应用类型:选择巡检采集项的应用类型。
· 警告级别:选择采集指标数据不符合要求时的警告级别,包括重要和一般。
· 采集项名称:输入或选择采集项的名称。
· 命令类型:选择采集指标数据的命令类型。
· 命令:输入采集该项指标数据时需要执行的命令。
· 检查要求:输入分析采集数据的标准。
· 改进意见:输入分析结果为不合格时,在巡检报告中提示用户改进的建议。
· 描述:输入采集项的描述信息。
· 规则类别:选择规则类别,分为如下两种:
¡ 匹配规则:将命令执行结果按所输入的规则进行匹配,并按照规则判断采集是否通过。选择该类别,需配置规则信息。
¡ 直接回显:将命令执行结果直接显示在巡检报告中。选择该类别不会进行分析,默认视为采集通过。
(3) 单击<确定>按钮。
(1) 在巡检采集项列表中,点击待修改的巡检采集项对应的“修改”图标,进入修改巡检采集项页面。
(2) 重新配置需要修改的参数即可。
(3) 修改完成后,单击<确定>按钮。
巡检采集项删除后,再次建立同名称的巡检采集项不会恢复已删除的数据。
(1) 在巡检采集项列表中,选择一个或多个待删除巡检采集项。
(2) 单击<删除>按钮,弹出确认对话框。单击<确定>按钮,删除所选巡检采集项。
查询的方法有两种,包括简单查询和高级查询。
(1) 简单查询
a. 在巡检采集项列表的右上角的查询条件输入框中输入采集系列,该查询支持模糊匹配。
b. 点击“查询”图标,采集模板列表中显示符合查询条件的采集模板。
(2) 高级查询
a. 点击查询框右侧的“高级”图标,展开查询区域。
b. 配置查询条件:
¡ 应用类型:在下拉框中选择巡检采集项的应用类型。
¡ 采集项名称:输入巡检采集项的名称。该查询条件支持模糊匹配。
¡ 采集项类型:在下拉框中选择巡检采集项类型,包括不限、自定义应用指标、预定义应用指标。
任意查询条件保持为空或选择为不限,则表示不将此查询条件作为过滤条件。
a. 单击<查询>按钮,巡检采集项列表中显示符合查询条件的采集项。
b. 单击<重置>按钮,所有查询条件重置为缺省值,巡检采集项列表中显示所有采集项。
c. 单击<关闭>按钮,关闭高级查询。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!