华为交换机查看设备状态

来自Linux78|wiki
Bob讨论 | 贡献2020年1月2日 (四) 10:03的版本 (Bob移动页面查看设备状态华为交换机查看设备状态
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

查看设备状态

查看设备序列号

display esn  (Equipment Serial Number)查看设备的序列号。
display device manufacture-info [ slot slot-id ]  查看设备的制造信息,包括序列号和制造日期。
查看设备整机序列号
display elabel slot slot-id,其中slot-id为对应设备的槽位号,可查看到如下电子标签信息,其中BarCode内容为设备序列号。
<HUAWEI> display elabel slot 0
查看光模块的序列号 
display elabel 查看光模块的电子标签,其中BarCode信息即光模块的序列号。
<HUAWEI> display elabel

查看硬件信息

查看设备信息

display device [ slot slot-id ],查看设备的部件信息和状态信息。
display device manufacture-info [ slot slot-id ],查看设备的制造信息。

查看设备的兼容信息

display compatible-information,查看当前设备的兼容信息。

查看电子标签

电子标签用来标识设备的硬件信息,包括序列号、生产日期、设备型号、硬件描述信息等。当用户硬件返修需要提供序列号时,或者需要了解硬件的生产日期等硬件信息时,可通过查看电子标签来获取到这些信息。

display elabel [ slot slot-id [ subcard-id ] ],查看设备的电子标签信息。

查看电源信息

display power,查看设备的电源状态信息。

查看风扇状态

display fan,查看设备的风扇状态。

查看光模块信息

display transceiver [ interface interface-type interface-number | slot slot-id ] [ verbose ],查看设备接口上的光模块信息。
display transceiver diagnosis interface [ interface-type interface-number ],显示光模块诊断参数。

查看温度信息

display temperature { all | slot slot-id },查看设备的温度信息。

查看版本及配置信息

display version [ slot slot-id ],查看设备的版本信息

查看诊断信息

display diagnostic-information [ acl | arp | bfd | defend | dhcp | l2adp | l3adp | lbdt | lldp | mcast | mpls | qos | rrpp | sdk | smlk | srm | stack | stat | stp | ucm ] [ file-name ],查看设备的诊断信息。

查看设备告警信息

display trapbuffer,查看最近时刻设备产生的告警。设备告警会记录到日志文件中,因此可通过查看日志文件,查看设备的历史告警信息。
display alarm active,查看设备启动后当前仍然未恢复的告警信息。
display alarm history,查看设备启动后记录的历史告警信息。
display alarm urgent [ slot slot-id | time interval ],查看设备硬件管理相关的告警信息。

查看CPU占用率

CPU占用率高是否影响数据转发?

华为交换机系统采用控制平面和转发平面分离的双平面架构,数据转发由以转发引擎为核心的转发平面完成。因此控制平面的CPU占用率过高一般不会影响转发面的数据转发。只有当控制平面由于CPU占用率过高出现了协议震荡等情况时,才可能引起转发表的变化进而影响数据转发。

CPU进程如VIDL、SOCK、RPCQ等的含义是什么?

进程名称  进程描述
VIDL 空闲任务。该任务对应的取值越大,CPU越空闲。
SOCK 收包处理任务。该任务占用率高,说明CPU收到大量协议报文并进行处理,可能是IP报文攻击导致。
RPCQ 板间通讯任务。该任务和SOCK任务可以结合在一起分析,如果收到大量报文且需要响应,该任务占用率会比较高,可能是受到报文攻击导致。
bcmRX/mv_rx 底层收包任务。该任务占用率高,说明CPU收到大量报文。
AGNT 实现IPv4 SNMP协议栈任务。该任务占用率高,可能是存在频繁的网管操作导致的。
AGT6 实现IPV6 SNMP协议栈任务。该任务占用率高,可能是存在频繁的网管操作导致的。
ROUT 路由模块处理任务。大量路由学习或者路由震荡时,该任务占用率较高,此时需要查看相关路由信息确定路由模块是否存在问题。
VPR 报文接收任务。接收通过单板CPU间数据报文通道传递的报文。

如何判断系统和进程的CPU占用率是否过高? 一般情况下,如果系统CPU占用率长时间运行时不超过80%,短时间内不超过95%,不是持续升高,且未产生CPU占用率过高的告警,可认为处于正常范围。系统也可能在某一瞬间CPU变高产生告警,但很快恢复正常,这有可能是设备刚启动、在某一时刻集中读取光模块信息、瞬间流量增多等各种具体情况导致,一般不影响设备运行,也属于正常现象。

对于每个CPU任务进程,可能会因为业务量和处理时间不同,CPU占用率值有时很低,有时又比较高。只要系统CPU占用率不超过80%并且未产生CPU占用率过高的告警,可认为处于正常范围。

display cpu-usage [ slave | slot slot-id ] [ vcpu vcpu ],查看CPU占用率的统计信息。
display cpu-usage history [ 1hour | 24hour | 72hour ] [ slave | slot slot-id ] [ vcpu vcpu-index ],查看CPU占用率的历史统计信息。
display cpu-usage configuration [ slave | slot slot-id ],查看CPU占用率的配置信息。

查看内存占用率

display memory-usage [ slave | slot slot-id ] [ vcpu vcpu-index ],查看内存占用率的统计信息。
不支持堆叠或者堆叠未使能的设备,不支持参数slave。

仅S5720-HI、S5730-HI、S5731-H、S5731-S、S5731S-H、S5731S-S、S5732-H、S6720-HI、S6730-H、S6730-S和S6730S-S支持vcpu vcpu-index参数。
 
执行命令display memory-usage threshold [ slot slot-id ],查看内存占用率的告警阈值。