GPEN训练数据降质方法：BSRGAN模拟真实退化教程-开发者社区

GPEN训练数据降质方法：BSRGAN模拟真实退化教程

GPEN人像修复增强模型镜像

本镜像基于GPEN人像修复增强模型构建，预装了完整的深度学习开发环境，集成了推理及评估所需的所有依赖，开箱即用。

1. 镜像环境说明

组件	版本
核心框架	PyTorch 2.5.0
CUDA 版本	12.4
Python 版本	3.11
推理代码位置	`/root/GPEN`

主要依赖库：

facexlib: 用于人脸检测与对齐
basicsr: 基础超分框架支持
opencv-python,numpy<2.0,datasets==2.21.0,pyarrow==12.0.1
sortedcontainers,addict,yapf

2. 快速上手

2.1 激活环境

conda activate torch25

2.2 模型推理 (Inference)

进入代码目录并使用预置脚本进行推理测试：

cd /root/GPEN

使用下面命令进行推理测试，可以通过命令行参数灵活指定输入图片。

# 场景 1：运行默认测试图 # 输出将保存为: output_Solvay_conference_1927.png python inference_gpen.py # 场景 2：修复自定义图片 # 输出将保存为: output_my_photo.jpg python inference_gpen.py --input ./my_photo.jpg # 场景 3：直接指定输出文件名 # 输出将保存为: custom_name.png python inference_gpen.py -i test.jpg -o custom_name.png

推理结果将自动保存在项目根目录下，测试结果如下：

3. 已包含权重文件

为保证开箱即用及离线推理能力，镜像内已预下载以下模型权重（如果没有运行推理脚本会自动下载）：

ModelScope 缓存路径：~/.cache/modelscope/hub/iic/cv_gpen_image-portrait-enhancement
包含内容：完整的预训练生成器、人脸检测器及对齐模型。

4. 训练数据准备：使用 BSRGAN 模拟真实退化过程

4.1 为什么需要高质量的低分辨率样本？

GPEN 是一种基于 GAN Prior 的一致超分辨率方法，其训练依赖于成对的高清图像（HR）和对应的低质量图像（LR）。与传统超分任务不同，GPEN 更关注“一致性”——即修复后的面部结构应尽可能贴近原始人脸，避免过度幻想或失真。

因此，训练数据的质量至关重要。如果 LR 图像只是简单地通过双三次下采样生成，模型学到的是理想化的退化模式，而在真实场景中，模糊、噪声、压缩伪影等复杂因素会让这种理想假设失效。

解决方案是：使用 BSRGAN 来模拟更接近真实世界的图像退化过程。

4.2 BSRGAN 简介

BSRGAN（Blind Super-Resolution with Degradation Estimation）是一种先进的盲超分退化建模方法，能够生成具有丰富纹理变化、非均匀模糊、多种噪声类型和 JPEG 压缩效应的低质量图像。相比 ESRGAN 或简单的下采样，它能更好地逼近真实手机拍摄、网络传输、监控截图等场景中的图像劣化方式。

这使得用 BSRGAN 生成的 LR-HR 对更适合训练 GPEN 这类追求真实感与结构一致性的模型。

4.3 实践步骤：从 FFHQ 到 BSRGAN 降质数据对

我们以 FFHQ 数据集为例，展示如何构建适用于 GPEN 训练的数据集。

步骤 1：准备原始高清图像

FFHQ 包含 70,000 张高分辨率人像（通常为 1024×1024），可作为 HR 源数据。

# 创建数据目录 mkdir -p /root/datasets/ffhq_hr # 将你的 FFHQ 图片复制到这里（建议先缩放到 512x512 或 1024x1024）

步骤 2：安装 BSRGAN 工具

git clone https://github.com/cszn/BSRGAN.git /root/BSRGAN cd /root/BSRGAN pip install -r requirements.txt

步骤 3：运行 BSRGAN 生成低质图像

BSRGAN 提供了预训练模型，可以直接用于图像降质。

# 示例：对单张图像应用 BSRGAN 退化 python generate_deg.py \ --file /root/datasets/ffhq_hr/00001.png \ --output_dir /root/datasets/ffhq_lr_bsr \ --scale 4

你也可以批量处理整个文件夹：

import os import subprocess hr_dir = "/root/datasets/ffhq_hr" lr_dir = "/root/datasets/ffhq_lr_bsr" os.makedirs(lr_dir, exist_ok=True) for img_name in os.listdir(hr_dir): hr_path = os.path.join(hr_dir, img_name) cmd = [ "python", "/root/BSRGAN/generate_deg.py", "--file", hr_path, "--output_dir", lr_dir, "--scale", "4" ] subprocess.run(cmd)

提示：你可以调整--scale参数控制下采样倍数（如 2x, 4x），并结合不同的 BSRGAN 模型（如BSRGANx2,BSRGANx4）来生成多样化的退化效果。

步骤 4：组织训练数据对

最终你的数据结构应如下所示：

/root/datasets/gpen_train/ ├── HR/ │ ├── 00001.png │ └── ... └── LR/ ├── 00001.png └── ...

确保每张 LR 图像与其对应 HR 图像同名，便于后续 DataLoader 加载。

5. 如何用于 GPEN 模型训练？

5.1 修改配置文件

GPEN 使用.yml文件管理训练参数。你需要修改/root/GPEN/options/train_gpen.yml中的数据路径：

datasets: train: name: FFHQ mode: GT dataroot_GT: /root/datasets/gpen_train/HR # 高清图像路径 dataroot_LQ: /root/datasets/gpen_train/LR # 低质图像路径 use_shuffle: True n_workers: 4 batch_size: 8

同时设置图像尺寸（推荐 512x512）：

gt_size: 512

5.2 启动训练

cd /root/GPEN python codes/train.py -opt options/train_gpen.yml

训练过程中，日志和模型权重将保存在experiments/目录下。

5.3 训练技巧建议

学习率设置：生成器初始学习率建议设为2e-4，判别器略低（如1e-4）
优化器：使用 AdamW，beta 设置为(0.9, 0.99)
总 epoch 数：对于 FFHQ 子集（约 10k 图像），建议训练 100–200 个 epoch
定期验证：可在val_freq字段设置每隔若干 epoch 在验证集上测试 PSNR/SSIM 指标

6. 效果对比：BSRGAN vs 双三次下采样

为了说明 BSRGAN 的优势，我们可以做一个小实验：

降质方式	模型泛化能力	细节恢复质量	真实感表现
双三次下采样	较差	一般	明显“塑料感”
BSRGAN 模拟退化	优秀	高	接近真实拍摄

当你用 BSRGAN 生成的 LR 数据训练 GPEN 后，再拿真实的老照片、模糊自拍去测试，你会发现：

肤色过渡更自然
眼睛、嘴唇等关键部位没有明显扭曲
头发边缘清晰但不生硬
整体看起来“像是本人”，而不是“AI画的”

这就是真实退化建模带来的巨大提升。

7. 总结

本文详细介绍了如何利用BSRGAN构建高质量的训练数据对，以支持GPEN 人像修复增强模型的有效训练。核心要点包括：

理解需求：GPEN 需要成对的 HR-LR 数据，且 LR 应模拟真实世界退化；
选择工具：BSRGAN 能生成包含模糊、噪声、压缩等多种退化的逼真低质图像；
实践流程：从 FFHQ 出发，使用 BSRGAN 批量生成 LR 图像，构建标准数据集；
训练集成：修改配置文件，加载新数据集，启动端到端训练；
效果验证：经 BSRGAN 训练的模型在真实场景中表现更鲁棒、更自然。

通过这套方法，你可以显著提升 GPEN 模型在实际业务中的可用性，无论是用于老照片修复、证件照增强还是社交媒体图像优化，都能获得更加可信的结果。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

GPEN训练数据降质方法：BSRGAN模拟真实退化教程