如何清理Heygem输出文件？磁盘空间管理技巧-开发者社区

如何清理Heygem输出文件？磁盘空间管理技巧

在使用 HeyGem 数字人视频生成系统进行批量处理时，随着任务的不断执行，outputs目录中会积累大量生成的视频文件。这些文件虽然对短期项目具有重要价值，但长期保留将迅速占用服务器磁盘空间，影响系统性能甚至导致任务失败。尤其在自动化部署、持续集成或高频率内容生产的场景下，有效的输出文件清理与磁盘空间管理策略成为保障系统稳定运行的关键环节。

本文将围绕HeyGem 数字人视频生成系统（批量版 WebUI）的实际架构和工作流程，提供一套完整、可落地的磁盘空间管理方案，涵盖自动清理机制、手动操作指南、脚本化维护以及预防性配置建议，帮助用户实现高效、安全的空间回收。

1. 理解输出文件存储结构

在深入清理策略之前，首先需要明确 HeyGem 系统的输出路径和文件组织方式，以便精准定位目标资源。

1.1 默认输出目录

根据官方文档说明，所有通过 WebUI 生成的数字人视频均保存在项目根目录下的outputs文件夹中：

/root/workspace/HeyGem-digital-human-video-generation-system/outputs/

该目录结构通常如下：

outputs/ ├── batch_results_20250401_1430/ │ ├── result_001.mp4 │ ├── result_002.mp4 │ └── audio.wav ├── single_result_20250402_0915.mp4 └── ...

批量任务：以时间戳命名的子目录，包含多个输出视频及原始音频副本。
单个任务：直接生成独立.mp4文件。

提示：可通过查看/root/workspace/运行实时日志.log中的日志记录确认具体写入路径。

1.2 文件大小预估

了解单个输出文件的大致体积有助于评估存储压力：

视频分辨率	平均码率	1分钟视频大小	5分钟视频大小
720p	4 Mbps	~30 MB	~150 MB
1080p	8 Mbps	~60 MB	~300 MB

若每日生成 50 个 3 分钟 1080p 视频，则日增数据量约为9 GB。一个月即可消耗近270 GB存储空间。

2. 手动清理方法：WebUI 与命令行双路径

HeyGem 提供了两种主要的手动清理方式：通过图形界面操作历史记录，或直接在终端删除物理文件。

2.1 使用 WebUI 清理历史结果

适用于希望保留部分成果并选择性删除的场景。

操作步骤：

登录 HeyGem WebUI：http://<服务器IP>:7860
切换至「批量处理模式」标签页
在“生成结果历史”区域：
删除单个视频：点击缩略图选中目标 → 点击“🗑️ 删除当前视频”
批量删除多个：勾选多个视频 → 点击“🗑️ 批量删除选中”
清空全部历史：逐页勾选所有项后执行批量删除

注意：此操作仅从 WebUI 前端移除条目，并同步删除对应物理文件，属于安全清理方式。

2.2 命令行直接清理输出目录

适用于大规模清理或自动化脚本调用。

查看当前占用情况

du -sh /root/workspace/HeyGem-digital-human-video-generation-system/outputs/

输出示例：

12G outputs/

删除特定日期前的文件（按时间过滤）

使用find命令查找并删除 7 天前的文件：

find /root/workspace/HeyGem-digital-human-video-generation-system/outputs/ -type f -mtime +7 -name "*.mp4" -delete

-mtime +7：修改时间超过 7 天
-name "*.mp4"：匹配视频文件
-delete：执行删除（谨慎使用）

清空整个 outputs 目录（慎用）

rm -rf /root/workspace/HeyGem-digital-human-video-generation-system/outputs/*

警告：该命令不可逆，请确保已备份必要文件。

3. 自动化清理脚本设计与部署

为避免人工干预带来的延迟和遗漏，推荐部署定时任务自动执行空间清理。

3.1 编写自动化清理脚本

创建脚本文件clean_heygem_outputs.sh：

#!/bin/bash # HeyGem 输出目录 OUTPUT_DIR="/root/workspace/HeyGem-digital-human-video-generation-system/outputs" # 日志文件 LOG_FILE="/root/workspace/cleanup.log" # 记录开始时间 echo "[$(date '+%Y-%m-%d %H:%M:%S')] 开始执行 HeyGem 输出文件清理" >> "$LOG_FILE" # 统计清理前大小 BEFORE_SIZE=$(du -sh "$OUTPUT_DIR" 2>/dev/null | awk '{print $1}') # 删除7天前的所有MP4文件 find "$OUTPUT_DIR" -type f -name "*.mp4" -mtime +7 -exec rm -f {} \; if [ $? -eq 0 ]; then echo "[$(date '+%Y-%m-%d %H:%M:%S')] 成功删除7天前的MP4文件" >> "$LOG_FILE" else echo "[$(date '+%Y-%m-%d %H:%M:%S')] 删除文件过程中出现错误" >> "$LOG_FILE" fi # 删除空目录 find "$OUTPUT_DIR" -type d -empty -delete echo "[$(date '+%Y-%m-%d %H:%M:%S')] 已清理空目录" >> "$LOG_FILE" # 统计清理后大小 AFTER_SIZE=$(du -sh "$OUTPUT_DIR" 2>/dev/null | awk '{print $1}') echo "[$(date '+%Y-%m-%d %H:%M:%S')] 清理完成 | 清理前: $BEFORE_SIZE → 清理后: $AFTER_SIZE" >> "$LOG_FILE" # 发送通知（可选） # curl -s "https://api.example.com/notify?msg=HeyGem清理完成: $BEFORE_SIZE→$AFTER_SIZE"

赋予执行权限

chmod +x clean_heygem_outputs.sh

3.2 配置定时任务（Crontab）

设置每天凌晨 2 点自动运行清理脚本：

crontab -e

添加以下行：

0 2 * * * /root/workspace/clean_heygem_outputs.sh

验证定时任务状态

crontab -l

建议：首次运行前可在测试环境中手动执行脚本，验证路径和逻辑正确性。

4. 预防性配置与最佳实践

除了事后清理，更应从源头控制输出增长，建立可持续的空间管理机制。

4.1 设置最大保留周期

在业务允许的前提下，制定统一的数据保留策略：

临时测试数据：保留 ≤ 3 天
正式产出视频：归档至外部存储（如 NAS、OSS），本地保留 ≤ 30 天
模型调试中间件：即时删除，不进入 outputs

可在脚本中加入分类判断逻辑，例如：

# 区分测试与生产任务（基于文件名前缀） find "$OUTPUT_DIR" -type f -name "test_*" -mtime +3 -delete find "$OUTPUT_DIR" -type f -name "prod_*" -mtime +30 -delete

4.2 启用日志轮转防止日志膨胀

系统日志/root/workspace/运行实时日志.log也可能持续增长，建议启用 logrotate。

创建配置文件/etc/logrotate.d/heygem：

/root/workspace/运行实时日志.log { daily rotate 7 compress missingok notifempty copytruncate }

含义： - 每天轮转一次 - 最多保留 7 份旧日志 - 压缩归档 -copytruncate：复制后清空原文件，不影响正在写入的日志进程

4.3 监控磁盘使用并设置告警

定期检查磁盘使用率，防止因满载导致服务中断。

快速查看磁盘状态

df -h

输出示例：

Filesystem Size Used Avail Use% Mounted on /dev/vda1 50G 42G 5.6G 89% /

添加磁盘使用率监控脚本

#!/bin/bash THRESHOLD=90 CURRENT=$(df / | grep / | awk '{print $5}' | sed 's/%//') if [ "$CURRENT" -gt "$THRESHOLD" ]; then echo "警告：根分区使用率达 ${CURRENT}%，请立即清理！" | mail -s "磁盘空间告警" admin@example.com fi

结合 cron 每小时检查一次。

5. 总结

在使用 HeyGem 数字人视频生成系统的实际运维中，输出文件的积累是不可避免的副产品。若缺乏有效管理，轻则降低系统响应速度，重则引发任务失败或服务崩溃。本文从理解存储结构、手动清理、自动化脚本、预防配置四个维度出发，构建了一套完整的磁盘空间管理解决方案。

核心要点总结如下：

明确输出路径：掌握outputs目录结构是管理的第一步；
灵活运用清理手段：WebUI 适合小规模操作，命令行更适合批量处理；
实施自动化清理：通过find + crontab实现无人值守维护；
建立预防机制：设定保留策略、启用日志轮转、部署空间监控；
注重安全性：所有删除操作应先验证路径，避免误删关键数据。

通过上述措施，不仅可以显著延长服务器的可用生命周期，还能提升整体系统的稳定性与可维护性。对于计划长期运行 HeyGem 系统的企业或个人创作者而言，这是一套不可或缺的基础运维能力。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

如何清理Heygem输出文件？磁盘空间管理技巧