错误日志	原因
ORA-00942: table or view does not exist	监控Oracle所使用的用户权限不足。
ORA-01013: user requested cancel of current operation	采集SQL执行时间太长，超过了指定的查询超时时间，查询操作被中止。
ORA-12505: TNS:listener does not currently know of SID given in connect descriptor	检查Oracle的Listener是否启动，数据库是否启动，实例名是否填写正确。
ORA-12514: TNS:listener does not currently know of service requested in connect descriptor	检查Oracle的Listener是否启动，数据库是否启动，服务名是否填写正确。

(3) 如果以上步骤未解决问题，请收集版本、环境、问题描述、截图和日志等详细信息，并反馈给研发团队协助定位。

2.9 apm-rs日志常见报错定位

2.9.2 故障处理步骤

(1) itom-apm-rs运行日志常见错误如下所示：

表2 itom-apm-rs运行

错误日志	原因
java.net.SocketTimeoutException: connect timed out	接口连接超时，请根据具体的URL，检查服务是否启动，或者防火墙策略是否放通等。
java.net.UnknownHostException	IP地址或k8s service无法访问，可能是组件未安装，如java.net.UnknownHostException: itom-region-rs-svc。
No token is found or the token has expired.	请求的Token校验失败（E0707及更高版本）。
Token is null or verify error.	请求的Token校验失败（E0707之前的版本）。
java.net.ConnectException: Connection refused	连接被拒绝，请检查端口是否被占用，连接的服务是否运行，防火墙配置是否正确等。
调用服务接口返回401、403以及500状态码	· 返回401或403状态码时，请检查当前操作员是否有相应的操作权限或资源权限，例如是否有该访问参数模板的查看权限等。 · 返回500状态码时，请检查调用的服务运行是否正常，该服务日志中是否存在报错等。

(2) 如果以上步骤未解决问题，请收集版本、环境、问题描述、截图和日志等详细信息，并反馈给研发团队协助定位。

2.10 服务器/存储探测、添加监控失败

2.10.2 故障处理步骤

(1) 查看用户名、密码是否正确。

(2) 相关端口号是否被防火墙屏蔽，可以用下面方法测试：

¡ IPMI：进入到itom-collector-java的各个pod里，用ipmitool工具执行ipmitool -I lanplus -H ip -U username -P pwd fru，看是否有数据返回。如无数据返回，需要查看各参数是否填写正确，如果均正确，需要找研发定位。

图15 IPMI测试

¡ REST：进入到itom-collector-java的各个pod里，执行命令curl --connect-timeout 20 -i -k -X POST scheme://ip:port/json/login_session -H "Content-Type: application/x-www-form-urlencoded" -H "accept: application/json" -d '{"method":"login","user_login":"username","password":"pwd"}'，看是否有数据返回。如无数据返回，需要查看各参数是否填写正确，如果均正确，需要找研发定位。

图16 REST测试

¡ SMI-S：进入到itom-collector-java的任一个pod里，参照8.1 SMI-S小工具使用方式，如sh testClientSblim.sh 192.168.15.26 5989 /root/tpd 3paradm 3pardata false CIM_PRODUCT，看是否有数据返回。

eportplat-rs-54b5874997-6759z:/opt/iMCReportPlatRS/log/k-reportplat-rs-54b5874997-6759z.2021-05-25.log.zip /root/k-reportplat-rs-54b5874997-6759z.2021-05-25.log.zip -n service-software

3 AOM异常故障处理

3.1 设备信息采集失败报密钥不可用

3.1.1 故障描述

通过SSH从操作系统登录设备失败，并报密钥不可用错误。

图17 密钥不可用

3.1.2 故障处理步骤

(1) 分析原因：设备的SSH密钥长度过短。

(2) 重新在设备端生成SSH密钥长度大于2048。

3.2 设备信息采集失败报密钥校验失败

3.2.1 故障描述

通过SSH从操作系统登录设备失败，并报密钥校验失败错误。

图18 密钥校验失败

3.2.2 故障处理步骤

(1) 分析原因：设备的SSH密钥发生了变化。

(2) 执行命令kubectl get pods -n service-software | grep probe查看podname。输入kubectl exec -it podname bash进入pod。

(3) 删除已保存的密钥文件rm /root/.SSH/known_hosts（其中root需要换为实际的用户名）。

3.3 IP地址管理在开启分级分权后看不到历史扫描数据

3.3.1 故障描述

IP地址管理开启分级分权后，无法查看历史扫描数据。

3.3.2 故障处理步骤

(1) 开启分级分权后无法看到历史扫描数据是正常情况，重新执行扫描任务即可看到新的扫描的结果。

(2) 如果需要看历史扫描数据，请前往[IP地址管理>IP扫描管理>IP分级管理配置]页面为机构关闭分级分权，并在[自动化>参数管理>参数设置]页面将“IP地址管理是否开启分级分权”参数值配置为“否”。

3.4 IP地址管理在开启分级分权后提示无权限

3.4.1 故障描述

IP地址管理开启分级分权后，[IP地址管理]菜单下的所有页面提示无权限。

3.4.2 故障处理步骤

(1) 在[IP地址管理>IP扫描管理>IP分级管理配置]页面确认是否已为机构启用分级分权、配置IP范围。

(2) 若上一步确认已启用，需要在[自动化>参数管理>参数设置]页面，将“IP地址管理是否开启分级分权”参数值配置为“否”，再配置为“是”。

(3) 重新执行扫描任务即可看到新的扫描的结果。

(4) 若希望要看到历史的数据需要将(1)、(2)步骤中两个分级分权配置关闭。

4 BSM异常故障处理

4.1 无业务管理菜单

4.1.1 故障描述

已安装BSM组件，但是界面不显示相关业务管理菜单。

4.1.2 故障处理步骤

(1) 检查License Server中，安装的License是否齐全，需包含以下4个License（较早版本的License名称可能有些不同，请以使用的版本具体名称为准）：

¡ H3C U-Center2.0-BSM业务服务管理授权函（BSM功能授权的License）

¡ H3C U-Center2.0-BSM-XXX License（BSM数量授权的License）

¡ H3C U-Center2.0-BSM-UEM用户体验管理-XXX License（UEM数量授权的License）

¡ H3C U-Center2.0-智能运维软件

(2) 访问U-Center 2.0，进入[系统>License管理>License信息]页面，检查License信息列表中是否包含以下4个授权：

图19 License信息

(3) 检查IOM、BSM安装包是否已安装，且检查如下服务是否运行正常。

[root@ucenter ~]# kubectl get pod -n service-software | grep bsm

itom-bsm-receiver-65dbf49cc5-rdt7k 2/2 Running 0 28d

itom-bsm-rs-6456759c4f-q25cg 1/1 Running 5 23h

itom-bsm-ui-78487cdc8-hnb85 2/2 Running 0 4d

[root@ucenter ~]# kubectl get pod -n service-software | grep kafka

kafka-0-7bdf7bfc99-gmrvx 3/3 Running 0 30m

[root@ucenter ~]# kubectl get pod -n service-software | grep haproxy

haproxy-7d84cd8567-pj68d 1/1 Running 3 39d

[root@ucenter ~]# kubectl get pod -n service-software | grep influx-proxy-iop

itom-influx-proxy-iop-6dc469cc7f-jnv4w 1/1 Running 0 28d

[root@ucenter ~]# kubectl get pod -n service-software | grep redis

redismaster-7f8d68f557-vhrnn 1/1 Running 4 60d

redissentinel1-6964cfbb89-dsfzx 1/1 Running 4 60d

[root@ucenter ~]# kubectl get pod -n service-software | grep conf

k-confcenter-rs-7d6f8577d7-rqv76 2/2 Running 0 11d [root@ucenter ~]# kubectl get pod -n service-software | grep permission

k-permission-api-7458b44c85-8zn9f 2/2 Running 30 39d

(4) 查询下列central接口，检查BSM网关服务、网关路由是否正常。

/central/gateway/route?name=itom-bsm-rs

/central/gateway/route?name=itom-bsm-ui

/central/gateway/service?name=itom-bsm-rs

/central/gateway/ service?name=itom-bsm-ui

(5) 如果以上步骤未解决问题，请收集版本、环境、问题描述、截图和日志等详细信息，并反馈给研发团队协助定位。

4.2 服务未启动

4.2.1 故障描述

已安装BSM组件，但是相关服务未启动。

4.2.2 故障处理步骤

(1) 检查服务pod运行是否正常，例如：

[root@ucenter ~]# kubectl -n service-software get po | grep itom-bsm-rs

itom-bsm-rs-77576568d-z6hd4 1/1 Pending 0 2d20h

(2) 若状态为Pending，通常为环境资源不足导致，继续执行以下命令检查具体原因：

kubectl -n service-software describe po pod名称

例如：

kubectl -n service-software describe po itom-bsm-rs-77576568d-z6hd4

(3) 查看Events内容，会显示该pod无法调度的具体原因，比如CPU资源不足或内存不足等。

(4) 如果以上步骤未解决问题，请收集版本、环境、问题描述、截图和日志等详细信息，并反馈给研发团队协助定位。

4.3 业务列表无数据

4.3.1 故障描述

业务列表页面没有数据。

4.3.2 故障处理步骤

检查是否安装CMDB安装包并查看其服务是否正常、CMDB相关License是否配置、资源菜单是否显示。

[root@ucenter ~]# kubectl get pod -n service-software | grep cmdb

itom-cmdb-rs-k-5cc898bbf-tp5rp 1/1 Running 8 60d

itom-cmdb-topo-rs-k-68c6995c68-ncjmp 1/1 Running 0 25d

itom-cmdb-topo-ui-k-6b7c9d56f7-tm8s6 1/1 Running 0 25d

itom-cmdb-ui-k-779976bf58-747xn 1/1 Running 4 60d

4.4 业务分值数据不正确

4.4.1 故障描述

业务的分值与实际情况不符。

4.4.2 故障处理步骤

(1) 检查apm、uem、nqa、adt、alarm等服务是否正常、相关License是否配置、菜单是否显示。

[root@ucenter ~]# kubectl get pod -n service-software | grep uem-rs

itom-uem-rs-7cfc9f69ff-qznfp 2/2 Running 0 28d

[root@ucenter ~]# kubectl get pod -n service-software | grep apm-rs

itom-apm-rs-79798d49b-jlk6b 1/1 Running 0 28d

[root@ucenter ~]# kubectl get pod -n service-software | grep adt-rs

itom-adt-rs-54587d48bc-xg6g8 1/1 Running 0 4d21h

[root@ucenter ~]# kubectl get pod -n service-software | grep shm-rs

itom-shm-rs-69bf8b795b-9jzgl 1/1 Running 0 3d23h

[root@ucenter ~]# kubectl get pod -n service-software | grep alarm-rs

itom-alarm-rs-674fdffd5b-bx865 2/2 Running 2 11d

(2) 检查是否正确绑定“监控模板”、“用户体验”、“业务拨测”、“NQA拨测”。

4.5 业务告警无数据

4.5.1 故障描述

没有业务告警相关的数据。

4.5.2 故障处理步骤

检查alarm等服务是否正常、告警相关License是否配置、告警菜单是否显示。

[root@ucenter ~]# kubectl get pod -n service-software | grep alarm-rs

itom-alarm-rs-674fdffd5b-bx865 2/2 Running 2 11d

5 ITSM异常故障处理

5.1 没有流程顶部导航

5.1.1 故障描述

界面顶部导航栏没有“流程”页签。

5.1.2 故障处理步骤

(1) 检查License Server中，安装的License是否齐全，需包含以下2个License（较早版本的License名称可能有些不同，请以使用的版本具体名称为准）：

¡ H3C U-Center2.0-ITSM IT服务管理授权函（ITSM功能授权的License）

¡ H3C U-Center2.0-ITSM-XXX License（ITSM数量授权的License）

(2) 访问U-Center 2.0，进入[系统>License管理>License信息]页面，检查License信息列表中是否包含以下2个授权：

图20 License信息

(3) 检查ITSM包是否安装，且服务运行是否正常。

[root@matrix154 ~]# kubectl get pod -n service-software | grep itsm

itom-itsm-duty-844c4fd85c-xqnjd 1/1 Running 0 43h

itom-itsm-kbm-59bf8d6c55-xsxf7 1/1 Running 0 43h

itom-itsm-message-fc8686555-n9xg8 1/1 Running 0 43h

itom-itsm-mobileui-78689fb6d-cg6bv 1/1 Running 0 43h

itom-itsm-rs-ffc4cb7f-2fwvn 1/1 Running 0 43h

itom-itsm-rs-ffc4cb7f-gn5j9 1/1 Running 0 43h

itom-itsm-rs-ffc4cb7f-tfkl8 1/1 Running 0 43h

itom-itsm-schedule-847c9d6c7f-sr7cm 1/1 Running 0 43h

itom-itsm-ssd-ui-6d94bbc54c-cngkp 1/1 Running 0 43h

itom-itsm-ui-68b69f5f5b-8mn7c 1/1 Running 0 43h

(4) 如果以上步骤未解决问题，请收集版本、环境、问题描述、截图和日志等详细信息，并反馈给研发团队协助定位。

(2) 如果相等，说明计数用户已满，可以退出其他暂时不用的计数用户帐号，再重新登录当前需要使用的计数用户帐号。

(3) 如果以上步骤未解决问题，请收集版本、环境、问题描述、截图和日志等详细信息，并反馈给研发团队协助定位。

同步源优先级使用说明：

· 优先级仅用于配置多个同步源启用场景。

· 优先级数值越小优先级越高。

· 如多源同步数据中仅有一个源存在数据，则和优先级无关，将默认填充该数据。

6.2 监控某个采集指标和资源维护指标不一致

6.2.1 故障描述

监控资源采集的指标数据信息和资源维护中对应的数据信息不一样。

6.2.2 故障处理步骤

(1) 在资源维护中，通过对比数据源功能，查看是否有记录，有记录保存即可；没有需要确认内置功能同步数据源配置是否正确，确认监控的接口是否正确返回数据。

(2) 另外注意，资源同步配置的自动更新栏，“是”代表数据源发送变更之后同步数据时自动更新资源数据，“否”则写入数据差异管理。

6.3 监控列表有1条资源数据，资源维护中多于1条

6.3.1 故障描述

监控列表中显示1条资源数据，而资源维护中存在多条资源。

6.3.2 故障处理步骤

(1) 在资源类型定义中，确认主键和属性唯一校验是否正确。

(2) 同步数据源配置，确认同步键是否正确。

(3) 如果没有配置同步键，则默认使用主键进行对比数据。

6.5 无法自动显示CMDB生成的逻辑关系或物理链路

6.5.1 故障描述

无法自动显示资源生成的拓扑。

6.5.2 故障处理步骤

(1) 确认CMDB已经生成了配置项之间的逻辑关系或者物理链路。

(2) 如果是物理链路，确保链路信息中的左右节点id不为空。

(3) 在配置项所在资源拓扑或业务拓扑中，拖动任意节点并保存，刷新视图查看逻辑关系或物理链路是否正常显示。

6.7 未及时同步CMDB配置项字段修改

6.7.1 故障描述

资源拓扑中的配置项未及时同步。

6.7.2 故障处理步骤

(1) 移动其他任意节点，保存并刷新视图。

(2) 可以等待凌晨的自动数据同步，第二日观察数据是否正确。

(3) 可以将节点从本视图删除并保存，然后再次添加该配置项。

¡ H3C U-Center2.0-IOM-流量分析功能-XXX License（NTA数量授权的License）

¡ H3C U-Center2.0-IOM-DIG探针功能授权函（NTA探针数量授权的License）

¡ H3C U-Center2.0-智能运维软件

(2) 访问U-Center 2.0，进入[系统>License管理>License信息]页面，检查License信息列表中是否包含以下4个授权：

图21 License信息

(3) 检查IOM包是否安装，且服务运行是否正常。

[root@ucenter1 ~]# kubectl -n service-software get po -o wide | grep itom-ntam-rs

itom-ntam-rs-77576568d-z6hd4 1/1 Running 0 2d20h 177.177.40.152 ucenter2 <none> <none>

[root@ucenter1 ~]# kubectl get po -o wide | grep permission

k-permission-api-597b66fff4-pqp54 2/2 Running 0 20d 177.177.145.51 ucenter1 <none> <none>

(4) 如果以上步骤未解决问题，请收集版本、环境、问题描述、截图和日志等详细信息，并反馈给研发团队协助定位。

¡ itom-ntam-receiver-dm

¡ itom-ntam-rs

¡ itom-ntam-server

¡ itom-ntam-ui

(2) 若状态为Pending，通常为环境资源不足导致，继续执行以下命令检查具体原因：

kubectl -n service-software describe po <pod名称>

例如：

kubectl -n service-software describe po itom-ntam-rs-77576568d-z6hd4

(3) 查看Events内容，会显示该pod无法调度的具体原因，比如CPU资源不足或内存不足等。

(4) 如果以上步骤未解决问题，请收集版本、环境、问题描述、截图和日志等详细信息，并反馈给研发团队协助定位。

(3) 如果以上步骤都正常，则需要收集dispenser-dm\itom-ntam-receiver-dm\itom-ntam-rs的日志。

8 其他操作

8.1 SMI-S小工具使用方式

获取数据命令模板：testClientSblim.sh <ipAddress> <port> <namespace> <userName> <password> <namespacePrefix> <class>

参数说明：

· ipAddress：SMI-S Provider所在主机的地址。

· port：一般情况填写5988。smi-s provider的默认端口号是5988，没有启用ssl协议，走的是http方式；使用5989端口，需要启用ssl协议，走https方式。

· namespace：SMI-S Provider的命名空间。

· userName和password：SMI-S Provider的用户名和密码，当用户名或密码存在特殊字符时，分别添加双引号。

· namespacePrefix：填写false。

示例如下：

进入任一java-collector的pod内部的/opt/itom/smistool/路径下，执行上述命令

图22 工具路径

热门推荐

热门推荐

H3C服务器

HPE服务器

热门推荐

H3C存储

HPE存储

热门推荐

商用台式机

商用笔记本

商用显示器

配件

热门推荐

热门推荐

智能终端

技术解决方案

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

专业安全服务

安全运营服务

热门推荐

热门推荐

热门推荐

热门推荐

热门推荐

技术支持

自助服务

热门推荐

热门推荐

热门推荐

热门推荐

合作伙伴培训与认证

热门推荐

热门推荐

公司刊物

加入我们

国家/地区

H3C U-Center 2.0故障处理手册-5W100

目录

1 简介

2 IOM异常故障处理

2.1 无服务器、存储等APM菜单

2.7 Agent安装失败

2.7.1 本地安装Agent时报错

1. 故障描述

2. 故障处理步骤

2.7.2 远程安装Agent时报错

1. 故障描述

2. 故障处理步骤

1. 故障描述

2. 故障处理步骤

2.8 Oracle监控常见错误定位

2.9 apm-rs日志常见报错定位

2.10 服务器/存储探测、添加监控失败

3 AOM异常故障处理

3.3 IP地址管理在开启分级分权后看不到历史扫描数据

3.4 IP地址管理在开启分级分权后提示无权限

4 BSM异常故障处理