监控Docker系统
Prometheus + Grafana监控Docker系统搭建指南。
要实现对Docker的全面监控,需要按照以下步骤搭建Prometheus和Grafana并进行配置:
4.1、安装Prometheus
下载并解压
Prometheuswgethttps://github.com/prometheus/prometheus/releases/download/v2.47.0/prometheus-2.47.0.linux-amd64.tar.gztarxvfz prometheus-2.47.0.linux-amd64.tar.gzcdprometheus-2.47.0.linux-amd64配置
Prometheus
编辑prometheus.yml添加Docker监控目标:global:scrape_interval:15s# 数据采集间隔scrape_configs:-job_name:'prometheus'static_configs:-targets:['localhost:9090']-job_name:'docker'# Docker 监控任务static_configs:-targets:['localhost:9323']# 对应 Docker metrics-addr 配置启动
Prometheus./prometheus--config.file=prometheus.yml验证
Prometheus
访问http://localhost:9090,查看状态 → 目标,确保docker目标状态为UP
4.2、安装Grafana
添加
Grafana仓库并安装sudoapt-getinstall-yapt-transport-https software-properties-commonwget-q-O- https://packages.grafana.com/gpg.key|sudoapt-keyadd-echo"deb https://packages.grafana.com/oss/deb stable main"|sudotee-a/etc/apt/sources.list.d/grafana.listsudoapt-getupdatesudoapt-getinstallgrafana启动
Grafana服务sudosystemctl start grafana-serversudosystemctlenablegrafana-server验证
Grafana
访问http://localhost:3000,默认用户名 / 密码:admin/admin
4.3、配置Grafana数据源与仪表盘
- 添加
Prometheus数据源 - 登录
Grafana,导航至 配置 → 数据源 → 添加数据源 - 选择
PrometheusURL: http://localhost:9090 - 点击 “保存并测试”
- 导入
Docker监控仪表盘 - 导航至 仪表盘 → 管理 → 导入
- 输入仪表盘 ID: 11332 (Docker 综合监控) 或 893 (Docker 详细监控)
选择Prometheus数据源 - 点击 “导入”
4.4、高级配置:持久化与服务化
创建 Prometheus 服务文件
sudotee/etc/systemd/system/prometheus.service<<EOF [Unit] Description=Prometheus Wants=network-online.target After=network-online.target [Service] User=prometheus Group=prometheus Type=simple ExecStart=/usr/local/bin/prometheus \ --config.file=/etc/prometheus/prometheus.yml \ --storage.tsdb.path=/var/lib/prometheus/ \ --web.console.templates=/etc/prometheus/consoles \ --web.console.libraries=/etc/prometheus/console_libraries [Install] WantedBy=multi-user.target EOF创建数据目录并设置权限
sudomkdir-p/etc/prometheus /var/lib/prometheussudocpprometheus.yml /etc/prometheus/sudouseradd-rs/bin/false prometheussudochown-Rprometheus:prometheus /etc/prometheus /var/lib/prometheus启动并验证服务
sudosystemctl daemon-reloadsudosystemctl start prometheussudosystemctlenableprometheus
4.5、关键监控指标说明
- 导入的仪表盘通常包含以下核心监控板块:
- 容器概览
- 运行中 / 暂停 / 停止的容器数量
- 容器创建 / 启动 / 停止操作频率
- 资源使用
- CPU 使用率(系统 / 容器)
- 内存使用率(总内存 / 容器内存)
- 网络流量(入站 / 出站)
- 磁盘 I/O 速率
- 性能分析
- 容器启动耗时分布
- 镜像拉取 / 构建时间
- 服务响应延迟