重磅 | 腾讯云入选信通院“混沌工程先锋实践者"优秀案例
4月26日,由中国信息通信研究院(以下简称“中国信通院”)主办的“稳保计划”首届云系统稳定性大会在京召开。会上,中国信通院公布了“稳保计划”云系统稳定性领域的最新评估结果、混沌工程先锋实践者优秀案例评选结果,展示了稳定性保障计划的工作成果,公开了首批“稳定性守护者”成员,并全方位解读了云稳定性保障标准体系。
腾讯云混沌工程对于云计算应用案例成功入选“2021混沌工程先锋实践者”
腾讯云混沌演练平台(CFG)提供便捷、灵活、安全的混沌工程故障演习服务,除自动化故障注入外,还提供了观测指标,安全护栏等核心功能
【云顾问-混沌演练】欢乐互娱:新游上线混沌演练实践
欢乐互娱(上海)科技股份有限公司(以下简称“欢乐互娱”),是一家全球游戏研发和发行公司,聚焦于MMORPG和MMOACT两大品类,成功出品了众多知名游戏如《街机三国》、《龙之谷》和《英雄杀》等。2023年4月,欢乐互娱重磅新游大作《RO仙境传说》计划在东南亚发行,该项目开服规模大、影响用户范围广,做好游戏上线前的容灾准备以保障上线后的稳定性至关重要。
【云顾问-混沌】当DNS遭受攻击时,阁下当如何应对?
DNS攻击(投毒等)是一种比较常见的网络攻击手段。众所周知,当DNS被恶意篡改或者重定向之后,会导致互联网系统的大规模不可用或者甚至数据泄露。但是,长期以来,DNS 在互联网世界中的重要性却被人们所忽略。恶意的 DNS 污染、劫持,缺少高可用、可扩展等问题使得 DNS 成为攻击的热门目标。但当DNS遭受攻击时,阁下当如何应对?本文将会介绍如何通过腾讯云混沌演练平台进行DNS不可用/DNS篡改的模拟故障攻击,通过混沌实验帮助构建高韧性的系统。
【云顾问-混沌演练】容灾演练Game Day最佳实践——moomoo
富途控股有限公司(“富途”)是一家领先的数字化金融科技公司,专注于为用户提供覆盖多个市场的全数字化金融服务,继而提升投资体验。2019年3月8日,富途(Nasdaq: FUTU)正式登陆美国纳斯达克交易所。富途通过自主研发的一站式数字化金融服务平台富途牛牛和moomoo,为用户提供市场数据、财经资讯、投资社区、投资知识等服务;并通过集团旗下持牌券商,向客户提供港股、美股、A股通、新加坡股及澳股的股票交易和清算,融资融券,及财富管理等服务。富途以用户为中心构建起连接用户、投资者、分析师、媒体、企业和机构的投资生态系统。通过旗下富途安逸(FUTU I&E)品牌,集团为企业客户提供一站式ESOP解决方案、首次公开募股(IPO)分销、投资者关系和公共关系(IR&PR)等企业及机构服务,已成为多家知名企业信赖的合作伙伴。
【云顾问-混沌】服务宕机灾难预防手段:混沌工程
Salesforce 是领先的云软件应用程序,全球约15万组织数百万员工使用。提供客户关系管理全套服务,包括联系人管理、产品目录、订单管理、机会管理和销售管理等。无需额外投入维护、储存和管理记录,所有数据存储在上面。
【云顾问-混沌】Pod/Node 内存高负载故障注入
在复杂的分布式系统中,为了验证服务质量、监控告警、流量调度、弹性伸缩等能力,我们需要模拟不同的故障场景。本文将介绍如何使用混沌工具对 Pod/Node 进行内存负载故障注入,以达到指定的内存占用百分比。腾讯云混沌演练平台故障动作:标准集群 Pod/普通节点-内存利用率高。
【云顾问-混沌】容易忽视的分布式时间
时间在分布式系统中是一个重要且有趣的问题。时间是我们一直想要准确测量的量。为了知道特定事件在一天中的什么时间发生在特定计算机上,有必要将其时钟与权威的外部时间源同步。时间通常是系统事件完整性、系统日志、系统审计、系统故障排查以及系统取证的基本标准。在现代的复杂系统中很多地方都会和时间发生关系,比如基于时间的访问控制、加密认证等。很显然,在复杂的分布式系统中,准确的时间十分重要。既然时间这么重要,那时间不准确或者出现跳变的情况,会对系统产生影响吗?答案是会的。
【云顾问-混沌】[行业经验] 跨 AZ 容灾混沌演练
随着云计算技术的快速发展,越来越多的企业和组织将其业务迁移到云平台,以实现更高效、灵活和可扩展的资源管理。然而,由于云环境的复杂性高,也为业务稳定性带来了一定的挑战,那如何确保业务的高可用性和数据的安全性呢?进行跨 AZ(可用区)容灾和混沌演练变得尤为重要。
【云顾问-混沌演练】乐元素 x 腾讯云混沌演练平台:游戏业务同城双活改造最佳实践
乐元素是国内休闲益智游戏领域领航企业。为了给用户提供更稳定可靠的使用体验,在2023年Q2开始,乐元素运维、业务团队联合腾讯云售后专家和技术专家,基于针对乐元素旗下休闲游戏产品《开心消消乐》展开同城双活改造项目,目的是了解并改善业务容灾部署状况,进一步强化云上业务系统的容灾能力。
【云顾问-混沌】Pod/Node CPU 故障注入
在复杂的分布式系统中,为了验证服务质量、监控告警、流量调度、弹性伸缩等能力,我们需要模拟不同的故障场景。本文将介绍如何使用混沌工具对 Pod/Node 进行 CPU 负载故障注入,以达到指定的 CPU 负载百分比。
【云顾问-混沌】Pod/Node CPU 故障注入
在复杂的分布式系统中,为了验证服务质量、监控告警、流量调度、弹性伸缩等能力,我们需要模拟不同的故障场景。本文将介绍如何使用混沌工具对 Pod/Node 进行 CPU 负载故障注入,以达到指定的 CPU 负载百分比。
【云顾问-混沌】CPU 高负载故障演练
服务器 CPU 负载的异常升高往往会导致服务响应时长增加、任务堆积甚至系统假死、服务中断等问题。因此,稳定和高性能的服务器对于业务的顺利运行至关重要。然而,在日常的服务运维过程中,CPU 高负载却是非常常见的一种故障场景。引起 CPU 高负载的原因也多种多样,以下列举一些常见的原因:
【云顾问-混沌】CPU 高负载故障演练
服务器 CPU 负载的异常升高往往会导致服务响应时长增加、任务堆积甚至系统假死、服务中断等问题。因此,稳定和高性能的服务器对于业务的顺利运行至关重要。然而,在日常的服务运维过程中,CPU 高负载却是非常常见的一种故障场景。引起 CPU 高负载的原因也多种多样,以下列举一些常见的原因:
【云顾问-混沌演练】“练”出强大,腾讯云混沌演练平台斩获三项优秀案例荣誉!
中国信通院于2022年11月启动案例征集,活动旨在通过筛选行业最佳实践案例,为众多企业提供参考和指引,进而推动我国云服务稳定安全运行水平提升,保障各个行业数字化转型和稳定运营。作为首届活动,标志性、引领性意义重大。
【云顾问-混沌演练】“练”出强大,腾讯云混沌演练平台斩获三项优秀案例荣誉!
中国信通院于2022年11月启动案例征集,活动旨在通过筛选行业最佳实践案例,为众多企业提供参考和指引,进而推动我国云服务稳定安全运行水平提升,保障各个行业数字化转型和稳定运营。作为首届活动,标志性、引领性意义重大。
腾讯云上业务弹性实践案例
某客户在中秋及国庆期间进行推广活动,业务访问量是平常的几倍,由于访问量的突增,无法及时进行扩容来规避,虽客户内部已提前进行容量评估和预留, 也采用自建的自动化扩容机制,其时效性在突发情况下未能达到预期,导致本次双节活动产生不小的业务损失。
腾讯云上业务弹性实践案例
某客户在中秋及国庆期间进行推广活动,业务访问量是平常的几倍,由于访问量的突增,无法及时进行扩容来规避,虽客户内部已提前进行容量评估和预留, 也采用自建的自动化扩容机制,其时效性在突发情况下未能达到预期,导致本次双节活动产生不小的业务损失。
【云顾问-混沌】混沌工程GameDay
GameDay在混沌工程中可以理解为一次有计划的演练实践活动,可以持续一天,也可以持续几个小时,也可以持续几天,持续时间根据具体的目标而定。GameDay活动旨在对系统如何应对现实世界中的混乱状况进行演习。通常来讲,实施混沌GameDay的团队需要探索下面几个问题:
[云顾问-混沌][行业经验]混合云容灾混沌演练
混合云,顾名思义,是由公有云、私有云或其他云共同构成的宏观意义上云计算环境。公有云由各大云提供商提供,而私有云则是企业内部自行搭建并管理的云计算基础设施。混合云兼具公有云和私有云的优点,具备较高的收益和性能。但是基于混合云部署的业务系统往往复杂性高,维护成本大,因此也为业务稳定性带来了不小的挑战,为保证业务的稳定性,进行有规律的容灾演练是一种科学的方式。但是在复杂的混合云环境中进行容灾演练本身就比较复杂,涉及的云资源之多,进行混合云容灾演练的门槛高。
混合云演习常见案例
当检测到物理线路1发生故障,系统自动将流量切换至物理线路2,保证业务正常运行。故障修复后,流量自动切回。