李飞飞力荐:阿里巴巴高可用数据库解决方案
👆点击“博文视点Broadview”,获取更多书讯
《云数据库架构》一书全面介绍了主流数据库的技术特点,结合业务场景讲解了数据库技术选型和数据库架构的最佳实践。下面我们摘取本书第1章中对阿里云RDS MySQL三节点企业版的重点内容,让读者先睹为快。
数据库的高可用是个悠久的话题,目前以最常见的主备模式为例, 它主要有异步和半同步两种方式,但这两种方式都有各自的缺陷。
异步在主库宕机后,最后更新的记录有可能没有推送到从库,从而引发数据丢失。
半同步虽然会保证最少有一个从库接收到binlog,但同样有丢

云原生数据库 TDSQL-C 高可用,一键实现多可用区部署
随着云计算和大数据技术的飞速发展,云原生数据库逐渐成为企业 IT 架构的新趋势。腾讯云作为国内领先的云服务提供商,一直致力于云原生技术的研发和创新。今天,我们将为大家深度解析腾讯云原生数据库 TDSQL-C 的预置资源和 Serverless 两种实例形态,以及多可用区部署的特性,探讨多可用区部署背后的技术原理和应用场景。

云原生数据库 TDSQL-C 高可用,一键实现多可用区部署
随着云计算和大数据技术的飞速发展,云原生数据库逐渐成为企业 IT 架构的新趋势。腾讯云作为国内领先的云服务提供商,一直致力于云原生技术的研发和创新。今天,我们将为大家深度解析腾讯云原生数据库 TDSQL-C 的预置资源和 Serverless 两种实例形态,以及多可用区部署的特性,探讨多可用区部署背后的技术原理和应用场景。

【云顾问-混沌演练】欢乐互娱:新游上线混沌演练实践
欢乐互娱(上海)科技股份有限公司(以下简称“欢乐互娱”),是一家全球游戏研发和发行公司,聚焦于MMORPG和MMOACT两大品类,成功出品了众多知名游戏如《街机三国》、《龙之谷》和《英雄杀》等。2023年4月,欢乐互娱重磅新游大作《RO仙境传说》计划在东南亚发行,该项目开服规模大、影响用户范围广,做好游戏上线前的容灾准备以保障上线后的稳定性至关重要。

首批!腾讯专有云TCE和TCS通过信通院容灾认证
近日,腾讯专有云TCE和TCS 首批通过了中国信息通信研究院(以下简称信通院)《专有云容灾技术能力要求》,从基础设施能力、架构容灾能力、平台容灾能力三大类13子项88细项100%满足监管机构对专有云容灾的技术能力要求。TCE和TCS的容灾能力达到业界领先水平。

【云顾问-混沌演练】容灾演练Game Day最佳实践——moomoo
富途控股有限公司(“富途”)是一家领先的数字化金融科技公司,专注于为用户提供覆盖多个市场的全数字化金融服务,继而提升投资体验。2019年3月8日,富途(Nasdaq: FUTU)正式登陆美国纳斯达克交易所。富途通过自主研发的一站式数字化金融服务平台富途牛牛和moomoo,为用户提供市场数据、财经资讯、投资社区、投资知识等服务;并通过集团旗下持牌券商,向客户提供港股、美股、A股通、新加坡股及澳股的股票交易和清算,融资融券,及财富管理等服务。富途以用户为中心构建起连接用户、投资者、分析师、媒体、企业和机构的投资生态系统。通过旗下富途安逸(FUTU I&E)品牌,集团为企业客户提供一站式ESOP解决方案、首次公开募股(IPO)分销、投资者关系和公共关系(IR&PR)等企业及机构服务,已成为多家知名企业信赖的合作伙伴。

腾讯云 TDMQ for Apache Pulsar 多地区高可用容灾实践
本文将从四个维度,深入剖析 Pulsar 在多可用区高可用领域的容灾策略。首先,我们将从整体架构的角度切入,洞察其设计之精髓;其次,我们将探寻 Pulsar 在云原生领域的努力;再者,我们将聚焦 Pulsar 在高可用方面的设计,展现其稳健可靠的特性;最后,我们延申拓展 Pulsar 在跨地区同步方面的未来规划。

腾讯云 TDMQ for Apache Pulsar 多地区高可用容灾实践
本文将从四个维度,深入剖析 Pulsar 在多可用区高可用领域的容灾策略。首先,我们将从整体架构的角度切入,洞察其设计之精髓;其次,我们将探寻 Pulsar 在云原生领域的努力;再者,我们将聚焦 Pulsar 在高可用方面的设计,展现其稳健可靠的特性;最后,我们延申拓展 Pulsar 在跨地区同步方面的未来规划。

【云顾问-混沌演练】乐元素 x 腾讯云混沌演练平台:游戏业务同城双活改造最佳实践
乐元素是国内休闲益智游戏领域领航企业。为了给用户提供更稳定可靠的使用体验,在2023年Q2开始,乐元素运维、业务团队联合腾讯云售后专家和技术专家,基于针对乐元素旗下休闲游戏产品《开心消消乐》展开同城双活改造项目,目的是了解并改善业务容灾部署状况,进一步强化云上业务系统的容灾能力。
云时代的数据中台(三)
综上,像电商系统,一个“结算”、“下单”按钮,后台将调用超200次服务,如果用ESB的方式,收到信息的回应将超过几秒钟,客户体验不好,而且ESB中间件的压力也非常大。另外,如果ESB出现故障,将直接造成所有的业务系统down机。

作业帮实时计算平台高可用实践
随着业务的高速发展和实时计算的迭代,业务对实时计算的需求越来越多,对实时任务的稳定性要求也越来越高。对实时计算平台而言,底层调度系统及计算引擎的稳定性、高可用性就变的十分重要。本文主要围绕作业帮实时计算平台底层调度系统,从背景现状、目标与挑战、方案设计以及未来规划等几方面来展开。

【云顾问-混沌演练】精细演练,稳定云端——腾讯云助阵金蝶云,守护小微业务稳定高可用
为了给客户提供更优质、更可靠的服务,金蝶业务团队从2022年开始,就已经在腾讯云售后专家的协助下,陆续对业务系统完成双活改造。改造完成后,业务团队通过腾讯云混沌演练平台进行故障注入,以检验业务系统的容灾效果,从而提升业务系统韧性。本次演练主要针对金蝶小微业务线(精斗云&KIS云),涉及10大业务故障场景,是财务、新零售、电商等领域行业提高系统可用性的一次最佳实践。

【云顾问-混沌演练】迎难而上,腾讯云混沌工程实践之道揭秘
随着数字经济转型逐步深化,众多企业正迈入全面上云阶段。然而,云计算架构所带来的复杂性也让稳定性面临极大挑战。伴随着云计算规模的快速增长,云服务作为社会基础设施的重要性也日益提升。腾讯云深知质量乃生命线,稳定性至关重要且不容忽视。

公有云-实验二 实践高可用的云架构
企业A的论坛平台已经顺利上线。但是随着用户量的激增,原有的架构已经难以完全支撑论坛平台的正常运行。由于用户量的增加,前端负载压力也随之增大,而且难以解决单点故障的问题。每到周末论坛平台的访问量会比工作日的访问量大很大,在访问非高峰期闲置的资源造成浪费。因此需要结合腾讯云的负载均衡CLB和弹性伸缩AS升级原有架构。

“上云”还是“下云”?探云计算的下一站未来!
10月27日,X(原Twitter)工程技术发布帖子称,在过去的一年里,技术团队优化了 X 的云服务使用方式,着手将更多工作负载迁往本地基础设施。这一转变使 X 每月的云成本降低了 60%。所有媒体、Blob 存储均已下云,这使得 X 的整体云数据存储量缩减了 60%,还成功将云数据处理成本降低了 75%。

“上云”还是“下云”?探云计算的下一站未来!
10 月 27 日,X(原Twitter)工程技术发布帖子称,在过去的一年里,技术团队优化了 X 的云服务使用方式,着手将更多工作负载迁往本地基础设施。这一转变使 X 每月的云成本降低了 60%。所有媒体、Blob 存储均已下云,这使得 X 的整体云数据存储量缩减了 60%,还成功将云数据处理成本降低了 75%。

提高应用程序可用性的五个要点
构建一个高可用、可伸缩的应用程序不是一件容易的事,也不会是天上掉下来的馅饼。问题总会以你从未预期的方式出现,让你精心设计的功能对所有用户都停止工作。
不存在百分百的安全,该给你的系统上个保险了
故障,是每个技术人都不愿遇到,但却总会遇到的事件。程序Bug、安全漏洞、黑客攻击、服务器宕机、网络中断等诸多因素都有可能引发系统故障,使我们的业务面临瘫痪的窘境。这样的例子,国内外都在不断的发生,比如:
2020年,由于严重的全澳性IT故障,Coles的收银机全部不能联网,down机瘫痪。收银员扫不了货品顾客也不能结账,澳洲每家Coles超市都被迫暂时关闭。
2018年,上海的医疗保险信息系统就突发故障,波及上海各大医院的结算系统,致使大量市民在就医时无法正常使用医保卡,众多医院的排队窗口前纷纷大排长龙,场

高可用架构之异地多活
当谈到架构的高可用时,无论是高可用计算架构,还是高可用存储架构,其本质的设计目的都是为了解决部分服务器故障的场景下,如何保证系统能够继续提供服务。但在一些极端场景下,有可能所有服务器都出现故障。例如,典型的有机房断电、机房火灾、地震、水灾……这些极端情况会导致某个系统所有服务器都故障,或者业务整体瘫痪,而且即使有其他地区的备份,把备份业务系统全部恢复到能够正常提供业务,花费的时间也比较长,可能是半小时,也可能是一天。因为备份系统平时不对外提供服务,可能会存在很多隐藏的问题没有发现。如果业务期望达到即使在此类灾难性故障的情况下,业务也不受影响,或者在几分钟内就能够很快恢复,那么就需要设计异地多活架构。

SpringCloud Hystrix服务治理(3)
Hystrix 是国外知名的视频网站 Netflix 所开源的非常流行的高 可用架构框架。Hystrix 能够完美的解决分布式系统架构中打造高可用服务面临的一系列技术难题。
Hystrix “豪猪”,具有自我保护的能力。hystrix 通过如下机制来解决雪崩效应问题。
在微服务架构中,我们把每个业务都拆成了单个服务模块,然后 当有业务需求时,服务间可互相调用,但是,由于网络原因或者其他 一些因素,有可能出现服务不可用的情况,当某个服务出现问题时, 其他服务如果继续调用这个服务,就有可能出现线程阻塞,但如果同 时有大量的请求,就会造成线程资源被用完,这样就可能会导致服务 瘫痪,由于服务间会相互调用,很容易造成蝴蝶效应导致整个系统宕 掉。因此,就有人提出来断路器来解决这一问题。