文章目录
- Nginx+Keepalived 双机热备生产级实施方案模板
- 方案概述
- 一、方案架构与核心组件
- 1. 架构拓扑图
- 2. 核心组件说明
- 3. 服务器配置要求(生产级)
- 二、前置准备(主备节点均需执行)
- 1. 系统环境初始化
- (1)关闭防火墙与SELinux(生产环境可按需配置规则,避免直接关闭)
- (2)安装依赖包
- (3)时间同步(避免日志、证书等时间不一致)
- 2. 网络连通性验证
- 三、部署步骤(分主备节点执行)
- 第一部分:Nginx 部署与配置(主备节点一致)
- 1. 安装 Nginx(YUM 方式,稳定高效)
- 2. Nginx 核心配置(生产级优化)
- 3. 验证 Nginx 配置有效性
- 第二部分:Keepalived 部署与配置
- 1. 安装 Keepalived(主备节点均执行)
- 2. 编写 Nginx 健康检查脚本(主备节点均执行)
- 3. Keepalived 主节点(MASTER)配置
- 4. Keepalived 备节点(BACKUP)配置
- 5. (可选)编写切换通知脚本(主备节点均执行)
- 6. 重启 Keepalived 生效配置
- 四、测试验证(生产环境必做)
- 1. 基础状态验证
- (1)查看 VIP 绑定情况
- (2)访问 VIP 验证 Nginx 服务
- 2. 故障切换测试(核心验证)
- (1)模拟主节点 Nginx 故障
- (2)模拟主节点服务器宕机
- (3)主节点故障恢复测试
- 3. 边界场景测试
- 五、监控告警配置(生产级必备)
- 1. 日志收集
- (1)Nginx 日志轮转(避免日志占满硬盘)
- (2)Keepalived 日志配置(默认日志在 `/var/log/messages`,可单独拆分)
- 2. 监控指标配置(Prometheus+Grafana)
- (1)安装 Nginx 监控插件(nginx-prometheus-exporter)
- (2)Prometheus 配置监控目标
- (3)Grafana 导入 Dashboard
- 3. 告警规则配置(Prometheus)
- 六、日常维护与故障处理
- 1. 日常维护清单(每周执行)
- 2. 常见故障排查
- (1)VIP 无法漂移
- (2)Nginx 故障后未触发切换
- (3)切换后 VIP 访问失败
- (4)主节点恢复后抢占 VIP
- 七、交付物清单
- 八、定制化调整建议
Nginx+Keepalived 双机热备生产级实施方案模板
方案概述
本方案基于 Nginx(反向代理/负载均衡)+ Keepalived(高可用集群管理)实现双机热备,通过主备节点冗余部署、VIP 漂移、服务健康检查,确保 Nginx 服务中断时间(RTO)≤30秒、数据零丢失(RPO=0),适用于 Web 服务入口、API 网关等核心接入层场景,完全满足生产环境高可用要求。
一、方案架构与核心组件
1. 架构拓扑图
[用户请求] → [VIP: 192.168.1.100] → 主节点(MASTER):192.168.1.10(Nginx+Keepalived) ↓ 故障切换(自动) 备节点(BACKUP):192.168.1.11(Nginx+Keepalived) ↓ [后端应用集群/静态资源服务器]2. 核心组件说明
| 组件 | 作用 | 版本要求 |
|---|