【客户案例】巡检项:云服务器(CVM)带宽利用率过高

背景描述

某客户基于TKE容器自建Flink大数据平台,集群规模近千台cvm,该客户线上流计算任务均运行在该平台上,由于客户业务发展较快,某日一关键推荐算法类计算任务出现超时、任务失败问题。

经过技术排查,发现该任务在近一段时间内业务高峰期CVM带宽利用率持续增高,在故障发生日,带宽利用率打满,出现丢包,从而导致流计算任务在做checkpoint时快照上传出现延时,导致任务失败。

云顾问解决方案

在云顾问的高风险项报告中,客户通过订阅巡检报告,能够及时发现带宽利用率过高的风险项,通过横向扩容CVM,规避单台CVM带宽利用率过高的风险。