分布式核心知识-开发者社区

一、分布式基础概念

1. 什么是分布式

把一个单体系统拆分成多个独立服务，部署在不同服务器，通过网络协作完成业务，分担压力、提升并发与可用性。

2. 单体 vs 分布式

单体：代码集中、部署简单，高并发/大流量易瓶颈，牵一发而动全身。
分布式：服务解耦、可弹性扩容、团队并行开发，引入网络、数据一致性、调用复杂度等新问题。

3. 三大理论（面试必背）

CAP 定理

分布式系统无法同时满足一致性©、可用性(A)、分区容错性§，分区容错必选，只能在 C 和 A 之间取舍：

CP：保证一致性，牺牲可用性（如 ZooKeeper）
AP：保证可用性，牺牲强一致性（如 Eureka、大部分业务系统）

BASE 理论

对 CAP 的落地实践，互联网主流方案：

基本可用：故障时保证核心功能可用，允许部分降级
软状态：数据允许短暂不一致
最终一致性：数据最终会达成一致，不要求实时一致

一致性算法

Paxos：经典强一致算法，实现复杂
Raft：简化版 Paxos，易实现，主流（Nacos、Etcd、RocketMQ 均使用）

二、分布式四大核心问题 & 解决方案

1. 分布式会话（Session 共享）

问题：请求分发到不同服务/节点，原生 Session 不互通。
方案：

统一会话存储：Redis 集中存放 Session
前端 Token：无状态登录，JWT 主流方案
粘性会话（不推荐，负载不均）

2. 分布式 ID

问题：单机自增 ID 无法在多节点全局唯一。
常用方案：

UUID：简单，无序、过长、索引差
数据库自增：简单，单点瓶颈
雪花算法(SnowFlake)：主流，64位二进制，有序、高性能
Redis 自增：适合中小型系统
百度 UID、美团 Leaf：开源 ID 生成器

3. 分布式锁

问题：多服务/多节点竞争同一资源，保证互斥访问。

主流实现

基于 Redis
- 核心：SET key value NX EX 过期时间
- 问题：死锁、锁续期、锁误删、主从同步延迟
- 成熟框架：Redisson（看门狗续期、可重入、公平锁）
基于 ZooKeeper
- 临时有序节点 + 监听，性能略低于 Redis，一致性更强
基于数据库
- 悲观锁/乐观锁，性能差，仅低并发场景使用

4. 分布式事务（最难考点）

问题：跨多个服务/库，保证事务要么全部成功、要么全部回滚。

四大经典方案

2PC（两阶段提交）
准备阶段 → 提交/回滚；强一致，性能差，不适合高并发。
TCC（补偿事务）
Try(检查/预留) → Confirm(确认) → Cancel(回滚)；代码侵入高，性能较好。
本地消息表（异步确保）
本地事务 + 消息表 + 轮询补发；实现简单，业界常用。
SAGA 模式
长事务拆分，每个子事务配反向回滚操作。

主流框架

Seata：阿里开源，一站式分布式事务框架，支持 AT、TCC、SAGA 等模式，项目首选。

三、分布式核心组件（企业必用）

1. 注册中心（服务发现）

作用：服务注册、健康检测、地址拉取，解耦服务硬编码。

Nacos：国内主流，集注册中心+配置中心+动态DNS，兼容 AP/CP
Eureka：SpringCloud 原生，AP 架构，已停止更新
ZooKeeper：CP 架构，强一致，适合配置/选举，不建议纯服务注册

2. 配置中心

作用：统一管理配置、动态刷新，无需重启服务。

Nacos / Apollo / Spring Cloud Config

3. 网关 Gateway

作用：请求入口，统一路由、限流、熔断、鉴权、日志、灰度发布。
主流：Spring Cloud Gateway（替代旧版 Zuul）

4. 消息队列 MQ（异步解耦、削峰填谷）

核心场景：异步处理、流量削峰、服务解耦、数据同步。
主流中间件：

RocketMQ：阿里出品，功能全，事务消息优秀，国内电商首选
Kafka：高吞吐，大数据、日志收集首选
RabbitMQ：可靠性高，社区成熟

5. 熔断 & 限流 & 降级（高可用三板斧）

问题：服务雪崩（下游故障层层向上传导）。

熔断：下游异常多，直接切断调用，避免雪崩（Sentinel、Resilience4j）
限流：限制请求量，保护服务不被打垮（令牌桶、漏桶算法）
降级：非核心功能暂时关闭，保证核心业务可用

主流组件：Sentinel（阿里，轻量、功能全，国内首选）、Hystrix（停更）

6. 远程调用（RPC）

作用：跨服务方法调用，像调用本地方法一样简单。

OpenFeign：SpringCloud 原生，HTTP 协议，易用
Dubbo：阿里开源，TCP 协议，高性能 RPC 框架，微服务经典
gRPC：谷歌，跨语言，适合跨语言调用

四、分布式高可用 & 高并发设计

集群部署：服务多节点，单点故障不影响整体
负载均衡
- 客户端负载：Feign、Dubbo 内置（轮询、随机、加权轮询、一致性哈希）
- 服务端负载：Nginx
缓存体系
- 本地缓存：Caffeine、Guava
- 分布式缓存：Redis（缓存穿透、击穿、雪崩三大问题及解决方案）
读写分离 & 分库分表
- 读写分离：主库写、从库读，缓解单库压力
- 分库分表：水平分表、垂直分表，解决单表数据量过大问题
- 中间件：Sharding-JDBC、MyCat

五、高频面试题（精简答案）

CAP 和 BASE 怎么理解？
CAP 三选二，分区容错必然存在；BASE 是最终一致性，互联网分布式系统主流选型。
Redis 分布式锁存在哪些问题？怎么解决？
死锁（加过期时间）、锁误删（唯一标识）、续期（Redisson 看门狗）、主从延迟（Redlock）。
分布式事务有哪些方案？项目中用哪种？
2PC、TCC、本地消息表、SAGA；项目常用 Seata AT 模式。
为什么要用消息队列？
解耦、削峰、异步、流量控制。
服务雪崩怎么防护？
熔断、限流、降级、超时控制、重试机制。
Nacos 和 ZooKeeper 区别？
Nacos 偏向 AP，可用性高，适合微服务注册；ZK 偏向 CP，一致性强，适合配置、选举。

六、学习路线（循序渐进）

理解 CAP/BASE 理论
分布式 ID、分布式锁
注册中心 + 配置中心（Nacos）
RPC 远程调用（Dubbo/Feign）
网关 Gateway
熔断限流降级（Sentinel）
消息队列 MQ
分布式事务（Seata）
缓存、分库分表、读写分离

分布式核心知识