fft npainting lama二次开发接口文档：Python调用示例-开发者社区

fft npainting lama二次开发接口文档：Python调用示例

1. 引言与使用场景

你是否正在寻找一种高效、稳定的方式来实现图像修复？比如去除水印、移除不需要的物体、修复老照片瑕疵，甚至清除图片中的文字？如果你已经尝试过多种工具但效果不尽如人意，那么本文介绍的fft npainting lama图像修复系统可能会成为你的新选择。

这套系统基于先进的深度学习模型LaMa（Large Mask Inpainting），结合 FFT 频域处理技术，在保留原始图像结构和色彩的基础上，实现了高质量的内容填充。更重要的是，它不仅提供了直观的 WebUI 操作界面，还支持Python 接口调用，非常适合需要集成到自动化流程或后端服务中的开发者。

本文将重点讲解如何通过 Python 调用该系统的 API 接口，完成图像修复任务，并提供完整的代码示例和实用建议，帮助你快速上手并进行二次开发。

2. 系统运行环境与启动方式

在开始调用 API 之前，你需要确保fft npainting lama的 WebUI 服务已经在服务器上正常运行。

2.1 启动服务

进入项目目录并执行启动脚本：

cd /root/cv_fft_inpainting_lama bash start_app.sh

当看到以下提示时，表示服务已成功启动：

===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================

服务默认监听端口为7860，你可以通过浏览器访问http://<服务器IP>:7860查看 WebUI 界面。

注意：API 接口也是通过这个 HTTP 服务暴露出来的，因此必须保证服务处于运行状态。

3. WebUI 功能回顾与工作原理

为了更好地理解 API 调用逻辑，我们先简要回顾一下 WebUI 的操作流程：

用户上传一张图像；
使用画笔工具在图像上标注需要修复的区域（mask）；
点击“开始修复”按钮；
后端模型根据原图和 mask 生成修复结果；
返回修复后的图像并保存。

整个过程的核心是图像 + 掩码（mask）的输入组合。而我们的 Python 调用，本质上就是模拟这一流程，通过 HTTP 请求发送图像和掩码数据，获取返回的修复图像。

4. Python 调用 API 实现详解

4.1 接口说明

虽然官方未提供详细的 RESTful 文档，但通过对 WebUI 前端行为的分析，可以确定其核心接口路径如下：

请求地址：http://<服务器IP>:7860/api/predict/
请求方法：POST
参数格式：JSON，包含两个 base64 编码的图像字段：
- data：原始图像（Base64 编码）
- mask：修复区域的掩码图像（白色为修复区，黑色为保留区）

关键点：mask 图像必须与原图尺寸一致，且为单通道灰度图（或三通道但值相同），白色部分代表需要修复的区域。

4.2 完整调用示例代码

以下是一个完整的 Python 示例，展示如何准备图像和掩码，并调用 API 进行修复。

import requests import base64 from PIL import Image import numpy as np import io # 配置服务地址 API_URL = "http://127.0.0.1:7860/api/predict/" def image_to_base64(img): """将PIL图像转换为base64字符串""" buffer = io.BytesIO() img.save(buffer, format="PNG") return base64.b64encode(buffer.getvalue()).decode('utf-8') def create_mask_from_bbox(image_size, bbox): """ 根据边界框创建掩码（用于测试） bbox: (x1, y1, x2, y2) """ w, h = image_size mask = np.zeros((h, w), dtype=np.uint8) x1, y1, x2, y2 = bbox cv2.rectangle(mask, (x1, y1), (x2, y2), 255, -1) # 白色填充 return Image.fromarray(mask) # 可选：安装 opencv-python # pip install opencv-python import cv2 # 步骤1：加载原始图像 original_image = Image.open("test.jpg").convert("RGB") image_size = original_image.size # (width, height) # 步骤2：创建掩码（示例：移除中心矩形区域） bbox = (100, 100, 300, 300) # 要移除的区域坐标 mask_image = create_mask_from_bbox(image_size, bbox) # 步骤3：转为base64 img_b64 = image_to_base64(original_image) mask_b64 = image_to_base64(mask_image) # 步骤4：构造请求体 payload = { "data": [ img_b64, mask_b64 ] } # 步骤5：发送请求 try: response = requests.post(API_URL, json=payload, timeout=60) response.raise_for_status() result = response.json() if "data" in result and len(result["data"]) > 0: output_b64 = result["data"][0] # 返回的第一个是修复图像 # 解码并保存结果 output_data = base64.b64decode(output_b64) output_image = Image.open(io.BytesIO(output_data)) output_image.save("output_repaired.png") print("✅ 修复成功！结果已保存为 output_repaired.png") else: print("❌ 接口返回无数据:", result) except requests.exceptions.RequestException as e: print("⚠️ 请求失败:", str(e)) except Exception as e: print("⚠️ 处理异常:", str(e))

4.3 代码说明与注意事项

步骤	说明
`image_to_base64`	将 PIL 图像对象编码为 base64 字符串，便于网络传输
`create_mask_from_bbox`	创建一个简单的矩形掩码，实际应用中可用更复杂的分割模型生成
`mask_image`	必须与原图同尺寸，白色区域表示待修复部分
`payload["data"]`	数组顺序不能错：第一个是原图，第二个是 mask
`timeout=60`	设置超时时间，防止大图长时间无响应

提示：如果图像较大，处理时间可能超过 30 秒，请适当增加超时时间。

5. 二次开发建议与优化方向

如果你打算将此功能集成到生产环境中，以下是一些值得考虑的优化方向。

5.1 批量处理支持

可以通过循环调用 API 实现批量图像修复。建议加入队列机制或异步任务调度（如 Celery），避免阻塞主线程。

for img_path in image_list: process_single_image(img_path)

5.2 自动化掩码生成

手动绘制 mask 不适合自动化场景。可结合以下技术自动生成：

目标检测模型（YOLO、Detectron2）识别要移除的物体
语义分割模型（DeepLab、UNet）提取特定类别区域（如文字、水印）
边缘检测 + 形态学操作处理规则形状（如二维码、LOGO）

5.3 添加错误重试机制

网络不稳定时可能导致请求失败，建议添加重试逻辑：

from tenacity import retry, stop_after_attempt, wait_fixed @retry(stop=stop_after_attempt(3), wait=wait_fixed(2)) def call_api_safely(payload): return requests.post(API_URL, json=payload, timeout=60)

5.4 结果缓存与去重

对于重复上传的图像或相似 mask，可使用哈希值（如感知哈希 pHash）判断是否已处理过，避免重复计算。

6. 常见问题与解决方案

6.1 接口返回空或报错

检查服务是否运行：ps aux | grep app.py
查看日志输出是否有模型加载错误
确保传入的 base64 是有效的 PNG/JPG 数据
确认 mask 图像与原图尺寸完全一致

6.2 修复效果不理想

尝试扩大 mask 区域，让模型有更多上下文信息
避免过于复杂的背景或纹理重复区域
对于大面积缺失，建议分区域多次修复

6.3 内存不足或处理缓慢

限制输入图像分辨率在 2000px 以内
使用 GPU 加速（确认 CUDA 和 cuDNN 已正确安装）
关闭不必要的后台进程释放资源

7. 总结

通过本文的介绍，你应该已经掌握了如何使用 Python 调用fft npainting lama的图像修复接口，完成从图像准备、掩码生成到结果获取的全流程操作。这套方案不仅适用于个人项目，也能作为企业级图像预处理模块的一部分。

无论是去除水印、清理广告、修复旧照，还是构建智能修图工具，这种“图像+mask”的修复模式都具有极强的灵活性和实用性。结合自动化掩码生成技术，还能实现真正的无人值守图像处理流水线。

未来你还可以在此基础上进一步拓展，例如：

开发专属的客户端工具
集成到 CMS 或电商平台中自动清理商品图水印
构建 REST API 服务供多系统调用

只要掌握核心调用逻辑，无限可能就在眼前。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

fft npainting lama二次开发接口文档：Python调用示例