Pre
这部分的内容,将以电商大促为背景,讲解系统限流、降级熔断、负载均衡、稳定性指标、系统监控和日志系统等方面的内容。
今天一起来讨论一下,在面对电商大促、秒杀抢购等高并发的业务场景时,都有哪些高可用的保障手段。
身边的能感受到的高可用保障的手段
双十一零点下单的过程中,有没有经历过排队等待,或者系统不可用的情况呢?
还有双十一活动,当天往往是不支持退款的,对和订单无关的业务进行降级,比如订单退款。
服务降级是系统高可用的保障手段。以限制退款为例:
- 一方面从业务角度考虑,由于活动期间流量巨大,订单产生数量过大,需要节省平台和商家的人力资源,节省库存盘点等工作;
- 另一方面,退款处理并不是核心流程,在双十一当天,商家也没有这么多的资源来处理退款请求,在服务治理中,这是典型的业务降级,保护系统,对非核心业务做降级处理。
电商大促高可用活动保障的核心是稳定性 。
在服务治理中有一个服务可用性的概念,服务可用性是对服务等级协议 SLA 的描述,我们平时说的 4 个 9、5 个 9,就是 SLA。
在实际业务中,即使是 4 个 9 的可用性,可能也不足以满足业务需求。我们来做一个简单