腾讯云Elasticsearch重磅发布——多可用区容灾功能

为了满足客户对数据可靠性、服务稳定性及容灾方面越来越严苛的需求,腾讯云Elasticsearch于近期推出了集群跨可用区容灾的功能。目前腾讯云Elasticsearch集群支持跨两个可用区部署集群。使用支持多可用区容灾的集群可以保证,当一个可用区因为机房电力、网络等故障的原因导致不可用时,另外一个可用区的节点仍然能稳定、不间断的提供服务,保障客户业务的可靠性。

快速体验

进入腾讯云 Elasticsearch Service 购买页,选择部署方式>多可用区,选择一个 VPC 网络。与单可用区不同,需要设置两个可用区(当前只支持两个可用区部署),其他设置,除了要求节点数是偶数个以保证节点能均匀地分布在两个可用区之外,与选择单个可用区基本一致。

购买页

我们以上海地域为例,在部署方式中选择多可用区,目前我们仅支持双可用区,用户需要选择两个可用区及子网。数据节点数量会自动按可用区的倍数调整。为了保证集群的稳定性及可靠性,默认开启了专用主节点,可以选择三个或五个,专用主节点也会均匀的分布在三个可用区中,保证一个可用区发生不可用的情况下,不会出现超过一半的专用主节点挂掉的情况,始终保持集群有超过法定的主节点选举个数,保证了集群的可靠性。

由于开启多可用区容灾的集群,必须开启专用主节点,且最小三个,所以能支持多可用区容灾功能的地域必须最少支持三个地域。目前仅有部分大地域如北上广支持多可用区容灾的功能,其他暂时不开放的地域随着腾讯云机房的建设,我们也会持续的加入这个功能。

集群多可用区容灾原理

数据节点

为了使多可用区容灾的功能生效,用户需要遵守以下原则:

  1. 购买集群的数据节点个数为可用区个数的倍数,例如选择两个可用区容灾,那么数据节点个数应该为2、4、6、8...以此类推。
  2. 索引分片至少设置1副本,即保证集群始终有两份以上的数据。
    多可用区原理
    腾讯云Elasticsearch会自动的将用户所购买的数据节点均匀的部署在用户所选择的可用区中,且所部署的数据节点含有可用区感知的功能。该功能使用户数据的副本会分布到多个可用区中,保证单个可用区仅有一份副本。undefined腾讯云Elasticsearch提供VPC内负载均衡功能,用户通过我们提供的VIP连接集群,通过ES的API进行数据读写及集群控制操作。此VIP绑定了集群内部的所有数据节点,并提供负载均衡功能,用户所有请求会平均分布到集群的各个数据节点上。undefined此VIP还带有健康检查功能,如一个周期内多次检查确认某节点没有响应,健康检查功能会暂时从VIP的绑定列表中摘除有问题的节点,直到节点恢复正常。这样就保证了当某个节点宕机,或者某个机房可用区不可用的情况下,有问题的节点会自动的剔除,保证用户的客户端不会请求到有问题的节点,从而在可用区故障的情况下,实现客户业务无感知的切换,提高了客户业务的稳定性。

专用主节点

专用主节点分布

为了提高集群的可靠性,用户在使用多可用区容灾功能时最少要创建三个专用主节点,且分布在三个不同的可用区中。即便用户选择的是双可用区部署数据节点,我们也会自动的为用户再多选择一个可用区部署专用主节点。这种部署方式,可以保证,当一个可用区不可用时,集群依旧有超过半数的法定主节点选举个数,可以保证集群的正常选主。

ps:目前多可用区的功能还未对全部客户放开,如果您有使用多可用区的需求,欢迎联系您的售前架构师或商务经理