wireguard-跨云or vpc网络通讯方案

背景:

早期服务器集中于腾讯云,开始是传统网络。后面是自定义的私有网络vpc.当然了vpc中还有容器网络,容器的网络方案使用了默认的Global Router,并没有使用VPC-CNI的容器网络与云主机网络在同一个 VPC 内的方案(腾讯云官方文档还有了Cilium-Overlay 的方案,恩还有个测试环境的k8s集群是kubeadm自建的集群网络插件用的cilum).今年45月份有些新业务又跑在了某云上面,集群环境直接用了某云的ACK PRO。网络插件使用了Flannel ,也没有使用某云的Terway。现在的需求就是要把两个网络打通!

看了一下网上的各种方案:

1. 腾讯云与某云如何建立VPN连接(不过貌似某云侧vpn镜像找不到了,故未能跑通)

2.专线?某云腾讯云都有专线服务https://cloud.tencent.com/developer/article/1731806?from=15425。这样的也可以尝试一下?

3.WireGuard米开朗基杨大佬写过一系列的文章;如:基于 WireGuard 和 OpenVPN 的混合云基础架构建设

我也选择了WireGuard的方案.....

以下测试都基于新环境搭建,没有敢在现有的环境去搞......

终极实现目标

三个vpc

就先以ABC命名吧 !A B 网络双向互通c网络可以连接bA网络可以连接C?初步规划每个集群起码有2台服务器以上,可以ping通ssh目标网络服务器?恩 还可以在每个网络k8s集群中搞一个nginx service,用curl掉一下测试应用的访问?初步就算那么想的!

注:所谓互通都包括容器网络的通信!

VPC子网规划

还是依赖与这个神奇的工具:http://www.ab126.com/web/3552.html,还是拿10.0.0.0/8去分了。A网络腾讯云上海vpc网络设置为10.10.0.0/16, B网络某云网络10.20.0.0/16C网络腾讯云北京VPC10.40.0.0/21

关于A网络:

注意:创建子网subnet的时候手残了,没有注意本来wireguard-shanghai3对应上海三区,wireguard-shanghai4对应上海四区的,没有留意,就做成这样的了......

关于B网络

某云B网络创建VPC也创建了4个可用区。但是他的定义都是叫什么交换机!,如下:

注意:当然了B网络也选择了上海区域,与腾讯云A网络处于同一地区!

关于C网络

觉得A,B网络浪费资源了....就修改了一下子网掩码:

最终网段规划为10.40.0.0/21

subset子网如下:

关于容器的网络

A网络容器网络

A网络容器网络CIDR172.16.0.0/16,Service CIDR172.16.252.0/22(其实就是172.16.0.0/16)

B网络容器网络-以及某云ack集群的创建

恩 觉得容器网络 /16整段也有点浪费,修改一下就取172.17.0.0/20吧,本来就是演示的这些资源也都够用了,实际生产环境中,如果需要考虑多地域,or多集群,还考虑互通,应该合理划分子网资源!

由于某云容器服务需要填写Pod CIDR Service CIDR开始本来想直接分两个网段的但是操作失误删除了集群重建冲突了(开始用的某云自己的那操作系统,安装wireguard不顺畅,删除更换系统为centos7了!),就把172.17.0.0/20划分了四个子网取Pod CIDR172.17.8.0/22 Service CIDR172.17.12.0/22

c网络容器网络-以及tke集群的简单创建

以网络c为例:容器网络依然从172.17.0.0/16子网20去分吧!选择了172.17.16.0/20段

创建tke集群可以参考下图:

打开tke控制台,选择区域北京,新建:

输入集群名称(个人定义了),关键是集群网络选择前面创建的C网络(北京有好几个vpc网络呢),配置容器网络172.17.16.0/20

比较喜欢TKE容器网络的设置好带能搞在一个段里......某云的还要算一下。比较麻烦了,系统选择了ubuntu20.04,也不去用腾讯云自己的TencentOS Server了,怕跟某云的系统一样安装wireguard有问题(其实可以参考非标准内核的安装方式,懒得看了)......

下一步,特意添加了两台cvm且不在同一个subset:

默认下一步吧选择自己的登陆方式,我这里选择了自己的ssh-key方式!

可选组件就直接默认了,毕竟我这里主要是演示wireguard组网!下一步:

同意,完成等待创建ing......

c集群 两台server 10.40.2.6将安装wireguard,10.40.3.14后续作测试。

wireguard的安装

理一遍关系

注:某云ack操作系统智能选择centos7与alios 某云系统内核不是标准内核故操作系统我使用的centos7,腾讯云tke集群我用的是ubuntu 20.4系统!

每个个集群都初始保证两台server以上

A集群资源:

vpc网络资源10.10.0.0/16

容器网络资源:172.16.0.0/16

主机名

ip

subset

是否安装wireguard

VM-4-8-ubuntu

10.10.4.8

上海二区

VM-4-17-ubuntu

10.10.4.17

上海二区

VM-2-4-ubuntu

10.10.2.4

上海一区

B集群资源:

vpc网络资源10.20.0.0/16

容器网络资源:Pod CIDR172.17.8.0/22 Service CIDR172.17.12.0/22(17.17.0.0/20)

主机名

ip

交换机(subset)

是否安装wireguard

iZuf6fxoj4zcqlpe8jupv2Z

10.20.4.42

上海 可用区L(wireguard-shanghai4)

Zuf6fxoj4zcqlpe8jupv3Z

10.20.4.43

上海 可用区L(wireguard-shanghai4)

C集群资源:

vpc网络资源10.40.0.0/21

容器网络资源:Pod CIDR172.17.16.0/20 Service CIDR172.17.28.0/22

主机名

ip

subset

是否安装wireguard

VM-2-16-ubuntu

10.40.2.16

北京二区

** **VM-3-16-ubuntu

10.40.3.16

北京三区

前置条件:

防火墙都是关闭的,代理服务器(安装wireguard节点)开启了ip转发

保证net.ipv4.ip_forward = 1

代码语言:txt
复制
sysctl -p|grep ip_forward
net.ipv4.ip_forward = 1

A C网络各一节点安装wireguard

初步选择在10.10.4.8这台cvm安装wireguard

注:由于A C都是tke,且系统相同,我的安装演示都是在10.40.2.16节点上!主要是开始操作的时候没有截图......

代码语言:txt
复制
root@VM-2-16-ubuntu:~# uname -a
Linux VM-2-6-ubuntu 5.4.0-121-generic #137-Ubuntu SMP Wed Jun 15 13:33:07 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux

内核5.4

代码语言:txt
复制
sudo apt upgrade
sudo apt install wireguard-dkms wireguard-tools -y
sudo mkdir /etc/wireguard/keys
cd  /etc/wireguard/keys
sudo wg genkey > vpn-gw.key
sudo wg pubkey < vpn-gw.key > vpn-gw.pub

检查下 wireguard 模块是否已经加载,如果没有加载,试下执行 modprobe wireguard加载模块

代码语言:txt
复制
root@VM-2-16-ubuntu:/etc/wireguard/keys# lsmod |grep wire
root@VM-2-16-ubuntu:/etc/wireguard/keys# modprobe wireguard && lsmod | grep wireguard
wireguard             212992  0
ip6_udp_tunnel         16384  1 wireguard
udp_tunnel             16384  1 wireguard

注意:一般推荐是升级一下内核到linux-kernel 5.6以上,5.6kernel已经内置wireguard的mod,but鉴于集群的稳定性,我没有升级内核

B网络一节点安装wireguard

B网络服务器系统为centos7故yum操作安装wireguard:

代码语言:txt
复制
yum install epel-release https://www.elrepo.org/elrepo-release-7.el7.elrepo.noarch.rpm
yum install yum-plugin-elrepo
yum install kmod-wireguard wireguard-tools
#检查下 wireguard 模块是否已经加载,如果没有加载,试下执行 modprobe wireguard加载模块
modprobe wireguard
modprobe wireguard && lsmod | grep wireguard

注:关于内核是否升级看个人意愿。或者找一个额外机器升级....为了维护集群稳定性,未能升级内核

A B网络互通

基本就是实现下图这样B网络中容器and vpc网络通过cvm 10.20.4.42的公网ip 到A网络10.10.4.8的公网Ip 路由访问A网络中资源,反之A网络容器and vpc网络资源通过10.10.4.8的公网ip到B网络的10.20.4.42的公网ip路由访问B网络中资源(自己的理解,可能语言表达有误)

注意:10.30.0.1/24 10.10.30.2/24为wareguard网络,避免与各个网络地址冲突!

名词解释:

  • Interface

Address:这个是开启wg之后本机的隧道IP

ListenPort:这个就设置51820了忘了看了哪个文章的了

PrivateKey:本机的私钥/etc/wireguard/keys/vpn-gw.key

  • Peer

Public Key: 服务端(就是要连接的网络的有公网ip,安装wireguard的节点)的公钥即需要连接的对方10.20.4.42的/etc/wireguard/keys/vpn-gw.pub

Allow IPs: 需要走隧道的IP段, 一般包含隧道自身IP段, 以及要借道隧道的IP段, 但是这里设置并不会产生对应的route

Endpoint: 服务端的IP和端口

Persis.Keepalive: 25 保持活动的时间间隔

A网络10.10.4.8节点配置

10.10.4.8节点wg0.conf配置

cat /etc/wireguard/ wg0.conf

代码语言:txt
复制
[Interface]
   Address = 10.30.0.1/24
   ListenPort = 51820
   PrivateKey = xxxxxxxxxxxxxxxxxxxxxxxxxxx
   SaveConfig = false
   MTU = 1420
   # Internet Gateway config: nat wg0 out to the internet on ens5
   PostUp = iptables -A FORWARD -i wg0 -j ACCEPT; iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
   PostDown = iptables -D FORWARD -i wg0 -j ACCEPT; iptables -t nat -D POSTROUTING -o eth0 -j MASQUERADE
[Peer]
PublicKey = xxxxxxxxxxxxxxxxxxxxx
AllowedIPs = 10.30.0.0/24,10.20.0.0/16,172.17.0.0/20
[Peer]
   # Client1: aliyun-shanghai
   PublicKey = xxxxxxxxxxxxxxxxxxxxxxxx
   Endpoint = xxxxxxxx:51820
   AllowedIPs = 10.30.0.2/24,10.20.0.0/16,172.17.0.0/20
   PersistentKeepalive = 25

B网络10.20.4.42节点配置

10.20.4.42节点wg0.conf配置

cat /etc/wireguard/ wg0.conf

代码语言:txt
复制
[Interface]
   Address = 10.30.0.2/24
   ListenPort = 51820
   PrivateKey = xxxxxxxx
   SaveConfig = false
   MTU = 1420

Internet Gateway config: nat wg0 out to the internet on ens5

PostUp = iptables -A FORWARD -i wg0 -j ACCEPT; iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
PostDown = iptables -D FORWARD -i wg0 -j ACCEPT; iptables -t nat -D POSTROUTING -o eth0 -j MASQUERADE

[Peer]

Client1: MacOS-Desktop

PublicKey = xxxxxxx
Endpoint = xxxxx:51820
AllowedIPs = 10.30.0.2/24,10.10.0.0/16,172.16.0.0/16
PersistentKeepalive = 25
[Peer]
PublicKey = xxxxxxxxx
AllowedIPs = 10.30.0.1/16,10.10.0.0/16,172.16.0.0/16

启动服务:

注: 10.20.4.42 10.10.4.8都启动服务,关闭服务down只是演示,保持服务up启动!

代码语言:txt
复制
cd  /etc/wireguard
wg-quick up wg0

同理关闭服务就是:

代码语言:txt
复制
wg-quick down wg0

测试安装wireguard节点之间的互相通信:

10.10.4.8 ping 10.20.4.42

vpc内自定义路由

如何ping 通vpc内其他cvm等网络资源呢?

登陆腾讯云后台私有网络控制台找到对应vpc路由表,添加到B网络的路由(关于172.17.0.0/16网段并没有与B完全匹配.....C网络的容器网络我也会路由到这里就先这样写了)

同理,某云后台,打开路由表

将下一条指定到服务器i-uf6fxoj4zcqlpe8jupv2即10.20.4.42节点

测试一下其他节点的互通:

从A网络开始开始:

10.10.4.17 ping 10.20.4.42 10.20.4.43

换一个subset:

10.10.2.4 ping 10.20.4.42 10.20.4.43

可以在A集群10.10.4.8 tcpdump看一下icmp包的抓包:

反之B网络测试:

10.20.4.43 ping 10.10.4.8 10.10.4.17 10.10.2.4

AB 容器网络and vpc的互通:

A网络run 一个nginx deployment 并开启service:

没有开启内网访问,开启一下吧,否则都没有办法用kubectl,将生成文件内容copy到A集群任一节点用户家目录下./kube/config文件中(当然了可以不开启,直接控制台操作)

可以kubectl run or 控制台创建一个nginx镜像就好 主要是创建一个service:

B网络服务器对A网络容器网络的连通性测试
  • B网络服务器pingA网络 nginx pod service ip
  • B 网络服务器curl nginx pod service ip
B 网络集群创建pod 访问A 网络vpc and容器网络中应用:
代码语言:txt
复制
kubectl run php --image=richarvey/nginx-php-fpm

注意:可以随便找个带ping curl的镜像,这个镜像我是用习惯了

代码语言:txt
复制
[root@iZuf6fxoj4zcqlpe8jupv2Z wireguard]# kubectl exec -it php bash
  • B网络集群中pod ping A网络vpc cvm地址
  • B集网络集群pod ping A网络集群 中nginx pod service
  • B集网络集群pod curl A网络集群 中nginx pod service
A网络服务器对B网络容器连通性测试

B网络创建nginx deployment svc

  • 同理A 网络cvm ping B网络容器集群nginx pod svc ip
  • 同理curl 测试

curl就拿一台cvm测试了。。。。。

A 网络集群创建pod 访问B网络vpc and容器网络中应用:
代码语言:txt
复制
kubectl run php --image=richarvey/nginx-php-fpm
代码语言:txt
复制
root@VM-4-17-ubuntu:~/.kube# kubectl exec -it php bash
bash-5.1# ping 10.20.4.42
bash-5.1# ping 10.20.4.43

ping 容器网络

C连接B连通性测试

配置类:

由图中关系可见需要在10.20.4.42节点允许10.30.0.3/24的通信

B集群10.20.4.42节点wg0.conf增加10.30.0.3相关设置

代码语言:txt
复制
[Peer]
PublicKey = xxxxxxxxxxxxxxxxx
AllowedIPs = 10.30.0.3/24
代码语言:txt
复制
[root@iZuf6fxoj4zcqlpe8jupv2Z wireguard]# wg-quick down wg0
[root@iZuf6fxoj4zcqlpe8jupv2Z wireguard]# wg-quick up wg0

C集群10.40.2.16节点:

代码语言:txt
复制
root@VM-2-16-ubuntu:/etc/wireguard# pwd
/etc/wireguard
root@VM-2-16-ubuntu:/etc/wireguard# cat wg0.conf
[Interface]
Address = 10.30.0.3/24
ListenPort = 51820
PrivateKey = xxxxxxxxxxxxxxxxxxxxxx
SaveConfig = false
MTU = 1420

Internet Gateway config: nat wg0 out to the internet on ens5

PostUp = iptables -A FORWARD -i wg0 -j ACCEPT; iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
PostDown = iptables -D FORWARD -i wg0 -j ACCEPT; iptables -t nat -D POSTROUTING -o eth0 -j MASQUERADE
[Peer]

Client1: aliyun-shanghai

PublicKey = xxxxxxxxxxxxxxxxxxxxxxxxxx
Endpoint = xxxxxxxxxxxxxx:51820
AllowedIPs = 10.30.0.2/24,10.20.0.0/16,172.17.0.0/20
PersistentKeepalive = 25

代码语言:txt
复制
root@VM-2-16-ubuntu:/etc/wireguard# wg-quick up wg0

C集群cvm ping B集群vpc and nginx pod svc

C集群创建pod ping B集群网络 and 容器网络资源

C 集群其他节点ping B集群网络 and 容器网络资源

en 登陆另外一节点10.40.3.16 ping B集群节点不通?

恩 依然是路由的问题,找到vpc 路由表,添加路由

curl就稍微看一眼了

B集群ping C集群网络 and 容器网络资源

测试一下就好了....不通就是对的

A连接C连通性测试

配置类

C集群10.40.2.16节点

代码语言:txt
复制
root@VM-2-16-ubuntu:/etc/wireguard# cat wg0.conf
[Interface]
Address = 10.30.0.3/24
ListenPort = 51820
PrivateKey = xxxxxxxxxxxxxxxxxxxxx
SaveConfig = false
MTU = 1420

Internet Gateway config: nat wg0 out to the internet on ens5

PostUp = iptables -A FORWARD -i wg0 -j ACCEPT; iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
PostDown = iptables -D FORWARD -i wg0 -j ACCEPT; iptables -t nat -D POSTROUTING -o eth0 -j MASQUERADE
[Peer]

Client1: aliyun-shanghai

PublicKey = xxxxxxxxxxxxxxxxxxxxxxxxxxx
Endpoint = xxxxxxxxxxxxx:51820
AllowedIPs = 10.30.0.2/24,10.20.0.0/16,172.17.0.0/20
PersistentKeepalive = 25
[Peer]
PublicKey = xxxxxxxxxxxxxxxxxxxxxx
AllowedIPs = 10.30.0.1/24

wg-quick重启wg0服务

代码语言:txt
复制
root@VM-2-16-ubuntu:/etc/wireguard# wg-quick down wg0
root@VM-2-16-ubuntu:/etc/wireguard# wg-quick up wg0

A集群10.0.4.8节点:

代码语言:txt
复制
root@VM-4-8-ubuntu:/etc/wireguard# cat wg0.conf
[Interface]
Address = 10.30.0.1/24
ListenPort = 51820
PrivateKey = xxxxxxxxxxxxxxxxxxx
SaveConfig = false
MTU = 1420

Internet Gateway config: nat wg0 out to the internet on ens5

PostUp = iptables -A FORWARD -i wg0 -j ACCEPT; iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
PostDown = iptables -D FORWARD -i wg0 -j ACCEPT; iptables -t nat -D POSTROUTING -o eth0 -j MASQUERADE
[Peer]
PublicKey = xxxxxxxxxxxxxxxxxxxxxx
AllowedIPs = 10.30.0.0/24,10.20.0.0/16,172.17.0.0/20
[Peer]

Client1: aliyun-shanghai

PublicKey = xxxxxxxxxxxxxxxxxxxxxxxxx
Endpoint = xxxxxxxxxxxxx:51820
AllowedIPs = 10.30.0.2/24,10.20.0.0/16,172.17.0.0/20
PersistentKeepalive = 25
[Peer]

Client1: wireguard-beijing

PublicKey = xxxxxxxxxxxxxxxxxx
Endpoint = xxxxxxxxxxxxxxxxx:51820
AllowedIPs = 10.30.0.3/24,10.40.0.0/21,172.17.16.0/20
PersistentKeepalive = 25

代码语言:txt
复制
root@VM-4-8-ubuntu:/etc/wireguard# wg-quick down wg0
root@VM-4-8-ubuntu:/etc/wireguard# wg-quick up wg0

强调一下 防火墙 udp:51820

前面没有说特意拿C网络来说一下。防火墙要开通UDP:51820(或者着针对自己的ip地址),前面AB集群我都默认打开了。不开通的时候是ping 不通的,打开tcp:51820依然不通,打开udp:51820就可以ping 通了!

A集群CVM10.10.4.8(wireguard)节点ping C集群网络 and 容器网络资源

A集群进入容器pingC集群网络 and 容器网络资源

A集群其他CVM节点(安装wireguard节点外节点)ping C集群网络资源

A网络其他cvm ping C网络一定记得手动添加路由:

C集群 ping A集群

草草测试一下吧吧......

问题来了:

上面 A B CB AC的测试再作一遍发现....AB不通了:

看一眼AB 节点的配置文件

A集群

B集群

初步怀疑两个集群配置文件里面有冲突了?过程就是一次次改尝试

最终配置文件如下:

A集群10.0.4.8节点

代码语言:txt
复制
[Interface]
Address = 10.30.0.1/24
ListenPort = 51820
PrivateKey = xxxxxxxxxxxxxxxxxxxxxxx
SaveConfig = false
MTU = 1420

Internet Gateway config: nat wg0 out to the internet on ens5

PostUp = iptables -A FORWARD -i wg0 -j ACCEPT; iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
PostDown = iptables -D FORWARD -i wg0 -j ACCEPT; iptables -t nat -D POSTROUTING -o eth0 -j MASQUERADE
#[Peer]
#PublicKey =xxxxxxxxxxxxxxx
#AllowedIPs = 10.30.0.2/24
[Peer]

Client1: aliyun-shanghai

PublicKey =xxxxxxxxxxxxxxxxxxxxxx
Endpoint = xxxxxx:51820
AllowedIPs = 10.30.0.2/32,10.20.0.0/16,172.17.0.0/20
PersistentKeepalive = 25
[Peer]

Client1: wireguard-beijing

PublicKey = xxxxxxxxxxxxxxx
Endpoint = xxxxxxxx:51820
AllowedIPs = 10.30.0.3/32,10.40.0.0/21,172.17.16.0/20
PersistentKeepalive = 25

B集群10.20.4.42节点

代码语言:txt
复制
[Interface]
Address = 10.30.0.2/24
ListenPort = 51820
PrivateKey = xxxxxxxxxxxxxxxxxxxxx
SaveConfig = false
MTU = 1420

Internet Gateway config: nat wg0 out to the internet on ens5

PostUp = iptables -A FORWARD -i wg0 -j ACCEPT; iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
PostDown = iptables -D FORWARD -i wg0 -j ACCEPT; iptables -t nat -D POSTROUTING -o eth0 -j MASQUERADE
#[Peer]
#PublicKey = xxxxxxxxxxxxxxxxxxxxxxx
#AllowedIPs = 10.30.0.1/24
[Peer]

Client1: MacOS-Desktop

PublicKey = xxxxxxxxxxxxxxxxxxxxxxxx
Endpoint = xxxxxxxxxxxxxxxxxxx:51820
AllowedIPs = 10.30.0.1/32,10.10.0.0/16,172.16.0.0/16
PersistentKeepalive = 25
[Peer]
PublicKey = xxxxxxxxxxxxxxxxxxxx
AllowedIPs = 10.30.0.3/24

C集群10.40.2.16节点

代码语言:txt
复制
[Interface]
Address = 10.30.0.3/24
ListenPort = 51820
PrivateKey = xxxxxxxxxxxxxxx
SaveConfig = false
MTU = 1420

Internet Gateway config: nat wg0 out to the internet on ens5

PostUp = iptables -A FORWARD -i wg0 -j ACCEPT; iptables -t nat -A POSTROUTING -o eth0 -j MASQUERADE
PostDown = iptables -D FORWARD -i wg0 -j ACCEPT; iptables -t nat -D POSTROUTING -o eth0 -j MASQUERADE
[Peer]

Client1: aliyun-shanghai

PublicKey = xxxxxxxxxxxxxxxx
Endpoint = xxxxxxx:51820
AllowedIPs = 10.30.0.2/32,10.20.0.0/16,172.17.0.0/20
PersistentKeepalive = 25
[Peer]
PublicKey = xxxxxxxxxxxxxxxxxxxx
AllowedIPs = 10.30.0.1/32

代码语言:txt
复制
wg-quick down wg0
wg-quick up wg0

重复一遍各种Ping curl测试通过!

总结:

  1. wireguard跨网 组网还是很方便的
  2. 两个网络组网还好,三个组网要注意下子网掩码或者各种的冲突,不知道是否会覆盖冲突......
  3. 网络基础还是薄弱,没有搞太明白....但是好歹三个网络的测试搞通了
  4. 安全组防火墙的放行
  5. 新增自定义路由策略的添加