华为板卡/单板/插卡无法注册 故障排查

检查硬件型号是否匹配

操作步骤

  1. 当发现单板或插卡不注册时,需要首先确认设备是否支持该款单板或插卡。此时需要收集设备类型和单板、插卡型号。例如:执行命令display device查看设备类型,发现当前设备类型为S12708,并且可以确认5槽位单板注册失败。<HUAWEI> display device 12708’s Device status: Slot Sub Type Online Power Register Status Role ——————————————————————————- 1 – ET1D2G48TEA0 Present PowerOn Registered Normal NA 2 – ET1D2S04SX1E Present PowerOn Registered Normal NA 3 – ET1D2S04SX1E Present PowerOn Registered Normal NA 5 – – Present PowerOn Unregistered – NA 6 – ET1D2G48SX1E Present PowerOn Registered Abnormal NA 8 – ET1D2G48TX1E Present PowerOn Registered Normal NA 9 – ET1D2MPUA000 Present PowerOn Registered Normal Master 10 – ET1D2MPUA000 Present PowerOn Registered Normal Slave 12 – ET1D2SFUA000 Present PowerOn Registered Normal NA 14 – ET1D2SFUA000 Present PowerOn Registered Normal NA 1 EH1D2VS08000 Present PowerOn Registered Normal NA PWR1 – – Present PowerOn Registered Normal NA PWR3 – – Present PowerOn Registered Normal NA CMU1 – EH1D200CMU00 Present PowerOn Registered Normal Master FAN1 – – Present PowerOn Registered Normal NA FAN2 – – Present PowerOn Registered Normal NA FAN3 – – Present PowerOn Registered Normal NA FAN4 – – Present PowerOn Registered Normal NA 命令回显中,Register字段信息为Registered表示已注册;为Unregistered表示未注册。可在《硬件描述》手册中查看对应单板与设备的配套关系。如设备不支持该款单板,需要更换为支持的单板型号。需要特别注意的是:如果是POE单板,需要使用支持POE的机框,同时设备上需要使用POE电源。例如:下面版本信息中看到Support PoE行显示Yes,表示机框支持POE。<HUAWEI> display version Huawei Versatile Routing Platform Software VRP (R) software, Version 5.160 (S9300 V200R007C00) Copyright (C) 2000-2014 HUAWEI TECH CO., LTD Quidway S9303 Terabit Routing Switch uptime is 0 week, 2 days, 4 hours, 37 minutes BKP 0 version information: 1. PCB Version : LE02BAKN VER.A 2. Support PoE : Yes 3. Board Type : LE0KS9303 4. MPU Slot Quantity : 2 5. LPU Slot Quantity : 3 例如:如下设备POE1电源槽位提示Absent,表示没有插入POE电源模块。<HUAWEI> display power ————————————————————————– PowerID Online Mode State Current(A) Voltage(V) RealPwr(W) ————————————————————————– PWR1 Present DC Supply NotSupport NotSupport NotSupport PWR2 Absent – – – – – PoE1 Absent – – – – –

检查软件版本是否正确

操作步骤

  1. 确认当前的板卡可以在当前硬件环境中使用后,需要确认软件版本是否正确。不同的软件版本对板卡的支持情况不同,在这一步中需要确认,设备当前的版本是否支持该板卡。例如:查看到设备当前的软件版本为V200R007,那么V200R008及之后版本才推出的单板或插卡就无法注册成功。<HUAWEI> display version Huawei Versatile Routing Platform Software VRP (R) software, Version 5.160 (S12700 V200R007C00SPC500) Copyright (C) 2000-2014 HUAWEI TECH CO., LTD HUAWEI S12708 Terabit Routing Switch uptime is 0 week, 0 day, 21 hours, 32 minutes BKP 0 version information: 1. PCB Version : VER.B 2. Support PoE : No 3. Board Type : ET1D2BAKL 4. MPU Slot Quantity : 2 5. LPU Slot Quantity : 8 6. SFU Slot Quantity : 4

检查安装是否正确

操作步骤

  1. 如果通过上面的步骤确认当前软硬件环境对该故障板卡均可以支持。下一步需要确认板卡是否安装正确,这里需要重点关注板卡是否插在正确的槽位上,以及板卡是否插紧,插到位,两边卡扣卡紧

如果以上检查确认一切正常,单板仍无法注册,建议再等待几分钟;如依然无法注册,请重新拔插单板等待10分钟左右。

检查交叉测试是否正常

操作步骤

  1. 如果单板或插卡仍然注册不上,可以利用现场的硬件条件进行交叉测试。先将单板或插卡拔出,插入设备上的空闲槽位,确认安装正确后,查看单板或插卡能否正常注册。
    • 如果发现注册成功,则可能原来的槽位或主控存在故障。
    • 如果仍然无法注册,可以将故障单板或插卡插入其他设备中。
      • 如果单板或插卡在其他设备可以正常注册,可以查看原机框电源剩余功率是否足够。<HUAWEI> display power system The total power supplied : 1600.00(W) The maximum power needed : 461.00 (W) The remain power : 1139.00(W) // 电源剩余功率 The system rated power detail information : ————————————————- Slot BoardName State Power(W) ————————————————- 3 LPU board On 62.00 4 LPU board On 62.00 5 LPU board On 81.00 7 MPU board On 105.00 8 MPU board On 105.00 CMU1 CMU board On 1.00 FAN1 FAN board On 43.00 PWR1 PWR board On 1600.00
      • 如果仍无法正常注册,则该单板或插卡存在故障的可能性比较大。

收集信息并寻求技术支持

如果上述步骤未能解决问题,请先按如下步骤收集相关信息,然后寻求技术支持。

操作步骤

  1. 收集故障相关信息
    1. 收集启示录中各个操作步骤的执行结果。
      • 采集设备的电子标签信息。<HUAWEI> display elabel
      • 如果是单板,请采集单板的启动信息,为保证收集完整,请采集10分钟左右。
        • 如果是主控板,请使用串口线连接故障单板收集。
        • 如果是接口板,且软件版本为V100R006及之前版本,请进入隐藏模式,并使用set output board [n]命令收集。
        • 如果是接口板,且软件版本为V200R001和V200R002版本,请进入诊断模式,并使用set output board [n]命令收集。
        • 如果是接口板,且软件版本为V200R003及之后版本,请进入诊断模式,并使用set output slot [n]命令收集。
      例如:在V200R005版本的设备上收集槽位1上单板的启动信息。<HUAWEI> system-view [HUAWEI] diag [HUAWEI-diagnose] set output slot 1
    2. 一键式收集设备的所有诊断信息并导出文件。
      1. 在用户视图下,执行display diagnostic-information file-name命令,采集设备诊断信息并保存为文件。<HUAWEI> display diagnostic-information dia-info.txt Now saving the diagnostic information to the device 100% Info: The diagnostic information was saved to the device successfully.当诊断信息文件生成之后,您可以通过FTP、SFTP、SCP等方式将其从设备上导出,详细操作可参考管理本地文件
       注意:
      • 您可以在用户视图下执行dir命令,确认文件是否正确生成。
      • 您也可以直接执行display diagnostic-information命令,并通过终端日志存盘方式获取设备诊断信息文件,详细操作可参见设备诊断信息文件获取指导
      • 若输出诊断信息过长,可以按Ctrl+C停止。
      • 此命令主要用于问题定位,搜集系统诊断信息,搜集时可能会影响系统的性能(例如CPU占用率升高等)。因此,在系统正常运行时不建议执行此命令。
      • 严禁在连接到设备的多个终端上同时执行display diagnostic-information命令,否则可能造成设备的CPU占用率明显增高,导致设备性能下降。
    3. 收集设备的日志和告警信息并导出文件。
      1. 在用户视图下,执行save logfile all命令,将缓冲区的日志和告警信息保存为文件。<HUAWEI> save logfile all Info: Save logfile successfully. Info: Save diagnostic logfile successfully.当诊断信息文件生成之后,您可以通过FTP、SFTP、SCP等方式将其从设备上导出,详细操作可参考管理本地文件
       说明:您也可以直接执行display logbufferdisplay trapbuffer命令查看设备的日志和告警信息,并通过终端日志存盘方式获取日志和告警信息文件,操作方法与设备诊断信息文件的获取方式相同,