别再只会用df -h了！用ncdu揪出Linux服务器磁盘占满的‘真凶’（以Docker日志为例）-开发者社区

别再只会用df -h了！用ncdu揪出Linux服务器磁盘占满的‘真凶’（以Docker日志为例）

当服务器监控系统突然报警"磁盘使用率100%"，大多数运维新手的本能反应是输入df -h确认情况。这个命令确实能快速显示各分区的使用情况，但它就像医院体检报告上的"肝功能异常"提示——告诉你结果，却不解释病因。真正的系统诊断需要更专业的"医疗设备"，而ncdu正是这样一款能帮你精准定位问题的"内窥镜"工具。

1. 为什么传统诊断工具力不从心

在Linux系统中排查磁盘空间问题，du命令曾是大多数人的首选。但当你面对一个复杂的生产环境时，这个经典工具暴露出明显的局限性：

# 传统du命令的典型用法 du -sh /* | sort -h

这种方法存在三个致命缺陷：

扫描速度慢：需要完整遍历所有子目录才能计算大小
结果不直观：需要额外排序命令才能看清最大目录
操作风险高：误删系统关键文件的风险始终存在

更麻烦的是，当遇到Docker这类现代技术栈时，传统的空间分析方式往往失效。容器运行时产生的日志、缓存和分层镜像，其存储路径与常规应用完全不同，就像隐藏在迷宫深处的空间吞噬者。

2. ncdu：空间分析的手术刀

ncdu(NCurses Disk Usage)的出现彻底改变了游戏规则。这个基于ncurses库的工具提供了交互式界面和实时分析能力，其优势对比传统方法非常明显：

功能维度	du命令	ncdu工具
扫描速度	线性扫描	增量扫描
结果显示	需要额外处理	即时排序可视化
交互操作	纯命令行	可视化导航
风险控制	无保护机制	删除确认机制
深度分析	手动逐层检查	一键钻取

安装这个神器只需一条命令：

# Debian/Ubuntu系统 sudo apt install ncdu -y # RHEL/CentOS系统 sudo yum install ncdu -y

3. 实战：揪出Docker日志这个隐形杀手

让我们模拟一个真实场景：某台服务器/分区突然爆满，初步检查显示/var目录异常膨胀。以下是专业运维的排查流程：

启动深度扫描：
```
sudo ncdu /var
```

在交互界面中，使用j/k键导航，Enter键进入子目录。当发现/var/lib/docker目录异常时，立即聚焦：

--- /var/lib/docker -------------------------------------------------- 148.7GiB [##########] /containers 12.4GiB [# ] /overlay2 1.2GiB [ ] /volumes

进一步检查容器日志目录：

--- /var/lib/docker/containers/3a7b8...2e1f ------------------------- 148.7GiB [##########] 3a7b8...2e1f-json.log

警告：直接删除正在使用的日志文件可能导致应用异常。正确的做法是先清空内容而非直接删除文件。

4. 安全清理策略与预防措施

找到罪魁祸首后，需要根据不同类型采取差异化处理：

即时清理方案：

# 清空单个日志文件（保留inode） sudo truncate -s 0 /var/lib/docker/containers/*/*-json.log # 清理无用Docker对象（危险操作需确认） docker system prune -a

长期预防方案：

配置Docker日志轮转（在/etc/docker/daemon.json中）：

{ "log-driver": "json-file", "log-opts": { "max-size": "10m", "max-file": "3" } }

设置日志监控告警，当单个容器日志超过100MB时触发通知

定期执行安全检查脚本：

#!/bin/bash CRITICAL=$(find /var/lib/docker -type f -name "*.log" -size +1G) [ -z "$CRITICAL" ] || echo "发现超大日志文件：$CRITICAL" | mail -s "磁盘告警" admin@example.com

5. 高阶技巧：让ncdu更高效

专业运维人员通常会定制化使用ncdu：

排除特定目录加速扫描：
```
ncdu --exclude /proc --exclude /sys /
```
导出扫描结果供后续分析：
```
ncdu -o scan.result /
```

远程分析其他服务器：

ssh user@server "ncdu -o - /" | ncdu -f -

定时扫描对比发现异常增长：

# 首次扫描 ncdu -o baseline.scan /var # 后续对比 ncdu --compare baseline.scan /var

在处理完一次紧急磁盘爆满事故后，我养成了每周用ncdu做全盘检查的习惯。有次提前发现某个MySQL容器日志异常增长，及时处理避免了生产事故。这个工具现在已成为我的服务器健康检查清单中的必选项——毕竟在运维领域，预防总是比抢救来得轻松。

实战指南：将Vector VX1000驱动无缝集成至Tricore AUTOSAR平台

1. 获取VX1000驱动代码与工程准备第一次接触Vector VX1000设备时，我花了三天时间才搞明白从哪里获取官方驱动。Vector官网的文档结构像迷宫，最终在技术支持团队的邮件里找到了关键提示：必须使用与Tricore芯片型号严格匹配的驱动版本。比如TC…

李华

手把手教你用Multisim仿真蔡氏电路（2022电赛D题核心模块避坑指南）

2024电赛备战：Multisim仿真蔡氏电路全流程避坑手册混沌电路作为非线性动力学中的经典案例，在电子设计竞赛中常以"黑马题型"出现。去年电赛D题中，超过60%的参赛队伍在蔡氏电路模块遭遇波形失真、带宽不足等问题。本文将用工程视角拆…

李华

VConsole、Eruda、DebugXWeb三选一？一份给H5开发者的移动端调试工具选型指南

VConsole、Eruda、DebugXWeb三选一？一份给H5开发者的移动端调试工具选型指南移动端H5开发最让人头疼的莫过于调试环节——没有Chrome DevTools那样的强大工具，真机上的报错信息往往像被加密过一样难以解读。我曾在一个电商大促项目中，因为无…

李华

网络原理：HTTPS加密流程

在当今互联网时代，我们每天都在使用HTTPS访问网站，但你知道这背后的安全机制是如何工作的吗？本文将带你深入了解HTTPS的加密流程。1，为什么需要HTTPS？在我们深入探讨HTTPS之前，先思考一个问题：如…

李华

告别GUI！用JASS脚本在War3编辑器里写个‘刷怪’触发器（附原生函数查询指南）

告别GUI！用JASS脚本在War3编辑器里写个‘刷怪’触发器（附原生函数查询指南） 当你在《魔兽争霸3》地图编辑器中反复拖拽相同的触发器条件时，是否曾感到效率低下？当你想实现更复杂的刷怪逻辑时，是否发现图形界…

李华