故障现象
如图1所示,某局点BRAS设备下挂的OLT管理出现闪断现象,未影响OLT下挂用户上网。故障发生时,OLT设备无告警,流量无明显异常。但BRAS上存在上联聚合组1闪断现象,经过判断确定是由于上联中断导致OLT管理中断。
图1 BRAS 场景组网示意图
故障分析
OLT闪断的可能原因包括:
链路问题。
OLT设备问题。
M6000-S BRAS设备问题。
故障处理
1. 查询BRAS到OLT管理服务器的路由路径,OLT管理服务器IP地址为10.2.1.1。
通过对OLT管理服务器IP全量路由路径查询,发现BRAS设备学习的路由路径为BRAS到CR、CR到X市设(20.1.1.5)、X市设备(20.1.1.5)到OLT服务器。
2. 通过全量路由判断下一跳为20.1.1.5,对下一跳设备进行了路由跟踪,发现该路由只用一条,通过smartgroup1查询到,即只在CR1上可以寻到该路由,通过在BRAS上对该地址(20.1.1.5)进行全量路由排查,排除了该路由为主备路由。
3. 在无故障BRAS设备上对该地址路由进行查询,可以看到在无故障BRAS设备上该路由正常是两条等价路由。
4. 技术支持人员对两台BRAS设备的路由配置进行比对,发现在有故障的BRAS设备上未配置maximum-paths 8,默认数值为1,因此只有一条路由。链路中断后,到CR2方向的路由重新生成需要一定的时间,导致了OLT脱管。某些厂商OLT 的轮询时间比较短,更容易发生脱管问题。
无故障BRAS设备配置:
在有故障的BRAS设备的IS-IS协议全局模式下配置maximum-paths 8后,问题解决。
故障总结
不同厂商的OLT 管理轮询机制不同,某些厂商的OLT 轮询时间比较短,现场出现的OLT 脱管问题主要发生在OLT 轮询时间比较短的OLT 设备上。
250
