如何批量处理图片？AnimeGANv2脚本化部署实战教程-开发者社区

如何批量处理图片？AnimeGANv2脚本化部署实战教程

1. 引言：从单张转换到批量处理的工程升级

随着AI图像风格迁移技术的成熟，AnimeGANv2因其出色的二次元风格生成能力，在图像创意领域广受欢迎。它不仅能将真实人脸自然地转化为动漫形象，还具备轻量、快速、画质优的特点，特别适合在消费级设备上运行。

然而，官方提供的WebUI界面虽然友好，却仅支持单张图片上传与处理，难以满足实际项目中“批量处理数百张照片”的需求。本文将带你完成一次从交互式操作到脚本化自动化的完整升级，实现：

脱离WebUI，直接调用模型推理接口
批量读取目录中的图片并自动转换
保留原始文件名结构，输出至指定目录
支持CPU环境下的高效推理

这是一篇面向工程落地的实战教程，目标是让AnimeGANv2真正具备生产可用性。

2. 环境准备与项目结构搭建

2.1 前置依赖确认

确保你的运行环境已安装以下基础组件：

python >= 3.7 torch == 1.12.0+cpu torchvision == 0.13.0+cpu Pillow opencv-python numpy tqdm

如果你使用的是CSDN星图镜像广场提供的AnimeGANv2 CPU轻量版镜像，这些依赖已预装完毕，可跳过手动配置。

2.2 项目目录结构设计

为便于管理，建议创建如下工程结构：

animeganv2-batch/ ├── models/ # 存放训练好的权重文件 │ └── generator.pth # AnimeGANv2 宫崎骏风格模型 ├── input/ # 待处理的原始图片 ├── output/ # 输出的动漫风格图片 ├── inference.py # 核心推理脚本 └── utils.py # 图像预处理工具函数

提示：generator.pth可从项目GitHub仓库下载（如：https://github.com/TachibanaYoshino/AnimeGANv2），注意选择适用于CPU推理的版本。

3. 核心代码实现：构建批量推理管道

3.1 图像预处理模块（utils.py）

由于AnimeGANv2对输入尺寸有要求（通常为256×256），我们需要先对图片进行标准化处理，并保持人脸区域完整性。

# utils.py import cv2 import numpy as np from PIL import Image def preprocess_image(image_path, target_size=(256, 256)): """ 加载并预处理图像：缩放、归一化、转换为tensor格式 """ img = cv2.imread(image_path) if img is None: raise ValueError(f"无法读取图像: {image_path}") # BGR -> RGB img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 调整大小（保持比例填充） h, w = img.shape[:2] scale = target_size[0] / max(h, w) new_h, new_w = int(h * scale), int(w * scale) img_resized = cv2.resize(img, (new_w, new_h)) # 居中填充至目标尺寸 pad_h = (target_size[0] - new_h) // 2 pad_w = (target_size[1] - new_w) // 2 padded = np.pad(img_resized, ((pad_h, pad_h), (pad_w, pad_w), (0, 0)), mode='constant', constant_values=255) # 归一化到 [-1, 1] tensor = (padded.astype(np.float32) / 127.5) - 1.0 tensor = np.transpose(tensor, (2, 0, 1)) # HWC -> CHW return np.expand_dims(tensor, axis=0) # 添加 batch 维度

3.2 模型加载与推理逻辑（inference.py）

这是整个脚本的核心部分，负责加载模型、执行前向传播、后处理输出。

# inference.py import torch import os from tqdm import tqdm from PIL import Image import numpy as np from utils import preprocess_image # 设备选择 device = torch.device("cpu") # 兼容低配机器 def load_model(model_path): """ 加载AnimeGANv2生成器模型 """ model = torch.nn.Sequential( # 简化表示：实际结构应与训练时一致 torch.nn.Conv2d(3, 64, kernel_size=7, stride=1, padding=3), torch.nn.ReLU(), # 后续ResNet块和上采样层省略，此处仅为示意 # 实际部署请加载完整state_dict ) # 加载权重 state_dict = torch.load(model_path, map_location=device) # 过滤掉不需要的键（如优化器状态） filtered_state_dict = {k.replace('module.', ''): v for k, v in state_dict.items() if 'generator' in k} model.load_state_dict(filtered_state_dict, strict=False) model.to(device) model.eval() return model def postprocess_output(output_tensor): """ 将模型输出转换为可保存的图像 """ output_tensor = output_tensor.squeeze().cpu().detach().numpy() output_tensor = np.transpose(output_tensor, (1, 2, 0)) # CHW -> HWC output_tensor = (output_tensor + 1) * 127.5 # 反归一化 [0, 255] output_tensor = np.clip(output_tensor, 0, 255).astype(np.uint8) return Image.fromarray(output_tensor) def batch_inference(input_dir, output_dir, model_path): """ 批量处理指定目录下的所有图片 """ print("🚀 开始加载模型...") model = load_model(model_path) print("✅ 模型加载完成") os.makedirs(output_dir, exist_ok=True) supported_exts = ('.jpg', '.jpeg', '.png', '.bmp') image_files = [f for f in os.listdir(input_dir) if f.lower().endswith(supported_exts)] print(f"📁 发现 {len(image_files)} 张图片待处理") with torch.no_grad(): for filename in tqdm(image_files, desc="🔄 正在转换"): try: img_path = os.path.join(input_dir, filename) input_tensor = preprocess_image(img_path) input_tensor = torch.from_numpy(input_tensor).to(device) # 推理 output_tensor = model(input_tensor) # 后处理并保存 result_img = postprocess_output(output_tensor) save_path = os.path.join(output_dir, f"anime_{filename}") result_img.save(save_path, quality=95) except Exception as e: print(f"\n❌ 处理失败 {filename}: {str(e)}") continue print(f"🎉 批量处理完成！结果已保存至: {output_dir}")

3.3 使用说明：一键运行脚本

在终端中执行以下命令即可启动批量处理：

python inference.py --input_dir ./input --output_dir ./output --model_path ./models/generator.pth

注意：若需添加命令行参数支持，请使用argparse扩展上述脚本。

4. 实践问题与优化建议

4.1 常见问题及解决方案

问题现象	原因分析	解决方案
输出图像模糊或失真	输入图片分辨率过低	建议输入不低于512×512的清晰图像
推理速度慢（>5秒/张）	使用了非优化模型或GPU未启用	切换至TorchScript导出模型或启用CUDA
内存溢出（OOM）	批处理过大或图片过多	设置batch_size=1，逐张处理
文件名乱码或路径错误	路径含中文或特殊字符	使用英文路径，避免空格