云杂谈:专线故障排查案例分享,理顺思路

今天就来聊一聊小编在云服务过程中遇到专线相关问题,有简单的两个案例分享,通过案例来说说平时的排障思路,希望能帮助到大家!

案例1:因mac地址问题导致专线通道不通

客户故障背景:

客户IDC和腾讯云是通过两条专线静态路由接入进行主备互联,因为合作商线路故障,业务切换到备线;

客户在业务侧修改了路由表信息,将下一条路由指向了备线。

ip route-static 10.70.0.0 255.255.0.0 172.18.68.5

客户专线互联拓扑

主线恢复后,重新修改到vpc的路由

ip route-static 10.70.0.0 255.255.0.0 172.18.68.5

改成ip route-static 10.70.0.0 255.255.0.0 172.18.67.1

发现到腾讯云的业务就不通了。

排障思路:

1、从腾讯云侧ping客户互联ip,发现不通。mtr发现还没有到专线互联地址。

ping客户对端不通
腾讯云到客户侧mtr

2、客户反馈在接入交换机上ping通腾讯云端互联地址。mtr发现还没有到专线互联地址。

ping腾讯云端通
客户侧到腾讯云mtr

按理说,客户能ping通互联地址,mtr应该是可以到互联地址,但是这里并没有,这里有很大的疑问???

3、再次确认两端的物理端口都是up状态

4、确认腾讯云侧能收到客户业务网段路由,但是为啥ping不通对端互联地址?

5、确认客户侧的mac表项,发现明显对不上!

客户侧:

IP ADDRESS MAC ADDRESS EXPIRE(M) TYPE INTERFACE VPN-INSTANCE

VLAN/CEVLAN

------------------------------------------------------------------------------

172.18.67.2 e4c2-d1fe-66e7 I - Vlanif1341

172.18.67.1 e4a8-b63b-aefd 17 D-0 GE4/0/4

------------------------------------------------------------------------------

腾讯云侧:

腾讯云端口mac

原因分析:

客户侧没有正确学习到腾讯云侧的mac地址。是什么原因导致没有正确学习呢?中间合作商反馈是能够正确学习到腾讯云mac地址。后来了解到客户之前还有一条到百度云的专线,已经停用但是没有走流程让合作商清空配置,导致了后来恢复的时候学习到了百度云的mac。

客户之所以能ping通互联地址,因为客户之前百度云拉的专线互联地址和这次到腾讯云地址172.18.67.1 是一样的。

案例2:因路由收发网段问题导致专线通道不通

客户故障背景:

客户IDC和腾讯云是通专线BGP路由接入打通腾讯云和AWS,两端各有1台云主机,发现腾讯云机器到aws机器不通,只有1跳路由。

腾讯侧互联IP198.19.254.114/30

用户侧互联IP198.19.254.113/30

腾讯云地址:10.1.2.11、10.1.2.6

AWS地址:192.168.1.81

客户专线互联拓扑
腾讯云到aws

排障思路:

1、确认aws的机器traceroute能够到专线互联地址,说明aws侧能正常学习到腾讯云的路由

aws可以到腾讯云互联地址

2、核查两侧物理端口都是正常up状态。

3、腾讯云无法到对端互联地址,说明腾讯云侧没有正常学习到aws路由。登陆腾讯云接入设备核查路由,发现有收到,但是腾讯云后端设备没有收到对应路由。

接入设备能收到路由

4、确认发现客户发布路由网段不符合腾讯云接受网段要求,腾讯云控制台会有相对应提醒

https://cloud.tencent.com/document/product/216/546

原因分析:

客户发布路由网段不符合腾讯云接受网段要求。

总结

专线场景遇到的问题多种多样,这里也不一一陈述。所遇问题无非几种原因: 1、物理设备端口是否正常,光模块收发光等

2、两端是否进行了正常的路由收发

3、部分云厂商限制(如上面说的网段限制,路由条目数量限制等)

4、正确的mac表

。。。