fft npainting lama二次开发手册：接口扩展与功能定制详细步骤-开发者社区

fft npainting lama二次开发手册：接口扩展与功能定制详细步骤

1. 引言：为什么需要二次开发？

你已经用上了fft npainting lama这个图像修复工具，能轻松移除图片中的水印、物体或瑕疵。但如果你是个开发者，或者团队有定制化需求——比如想把修复功能集成进自己的系统、加个API接口、改个UI风格，甚至对接数据库自动处理批量任务，那光靠现成的WebUI就不够用了。

本文就是为你准备的——一份真正可落地的二次开发指南。我们不讲空理论，只说你能动手实现的东西。从代码结构解析到接口扩展，再到功能定制，一步步带你把fft npainting lama变成你自己的图像修复引擎。

本手册基于科哥发布的 cv_fft_inpainting_lama 项目进行讲解，所有操作均在本地环境验证通过。

2. 项目结构解析：搞懂每个文件是干啥的

要改一个项目，先得知道它长什么样。进入/root/cv_fft_inpainting_lama目录后，你会看到这些关键文件和文件夹：

cv_fft_inpainting_lama/ ├── app.py # WebUI主程序入口（Gradio搭建） ├── start_app.sh # 启动脚本 ├── config/ # 配置文件目录 ├── models/ # 模型权重存放位置 ├── modules/ # 核心功能模块 │ ├── inference.py # 推理逻辑核心 │ ├── preprocessing.py # 图像预处理 │ └── postprocessing.py # 后处理（如边缘羽化） ├── outputs/ # 输出结果保存路径 └── webui/ # 前端页面资源（可选）

2.1 核心文件说明

`app.py`—— WebUI 的心脏

这是整个界面的启动文件，使用 Gradio 构建交互式界面。主要做了三件事：

加载模型
定义输入输出组件（上传框、画笔、按钮等）
绑定“开始修复”按钮到推理函数

`inference.py`—— 修复能力的核心

这个文件才是真正调用lama模型做图像修复的地方。它接收原始图像和 mask（标注区域），返回修复后的图像。

def run_inpaint(image: np.ndarray, mask: np.ndarray) -> np.ndarray: # 模型加载、前处理、推理、后处理全流程 ... return result_image

`start_app.sh`—— 一键启动的秘密

别小看这个脚本，它隐藏了运行环境的关键信息：

#!/bin/bash python app.py --port 7860 --server_name 0.0.0.0

你可以在这里加参数，比如--share生成公网访问链接，或者指定 GPU 设备。

3. 扩展API接口：让系统支持外部调用

现在你的系统只能通过网页操作，但如果想让其他程序（比如一个电商后台）自动调用修复功能，就需要提供 API。

3.1 添加 FastAPI 支持（推荐方式）

虽然原项目用的是 Gradio，但它底层也是 Flask/Werkzeug，我们可以直接扩展路由。

第一步：修改`app.py`，引入 FastAPI 兼容层

from fastapi import FastAPI, UploadFile, File from fastapi.middleware.wsgi import WSGIMiddleware import gradio as gr # 在原有 Gradio app 创建之后 gr_app = gr.Blocks() # ... 原来的界面定义 ... # 创建 FastAPI 实例 fastapi_app = FastAPI() @fastapi_app.post("/api/inpaint") async def api_inpaint(image: UploadFile = File(...), mask: UploadFile = File(...)): import cv2 import numpy as np from modules.inference import run_inpaint # 读取图像 img_data = await image.read() mask_data = await mask.read() # 转为 OpenCV 格式 img = cv2.imdecode(np.frombuffer(img_data, np.uint8), cv2.IMREAD_COLOR) mask = cv2.imdecode(np.frombuffer(mask_data, np.uint8), cv2.IMREAD_GRAYSCALE) # 执行修复 result = run_inpaint(img, mask) # 保存并返回路径 output_path = f"outputs/api_{int(time.time())}.png" cv2.imwrite(output_path, result) return {"status": "success", "output_path": output_path}

第二步：将 FastAPI 挂载到 Gradio 上

# 将 FastAPI 集成进 Gradio 的服务器 app = gr.mounted_wsgi_app(fastapi_app, path="/api") # 启动时会同时支持 WebUI 和 API gr_app.launch(server_name="0.0.0.0", server_port=7860, prevent_thread_lock=True)

第三步：测试 API 调用

用curl测试一下：

curl -X POST "http://your-server:7860/api/inpaint" \ -F "image=@input.jpg" \ -F "mask=@mask.png"

{ "status": "success", "output_path": "outputs/api_1767604948.png" }

成功！你现在可以通过任何语言（Python、Java、Node.js）调用这个接口了。

4. 功能定制：按需改造系统行为

4.1 自定义输出命名规则

默认输出是outputs_YYYYMMDDHHMMSS.png，但你可能想要更清晰的名字，比如带上来源ID。

修改`app.py`中的保存逻辑：

import time import os def save_result(image): timestamp = time.strftime("%Y%m%d_%H%M%S") # 自定义命名：source_{id}_time.png filename = f"source_{get_source_id()}_at_{timestamp}.png" output_path = os.path.join("outputs", filename) cv2.imwrite(output_path, image) return output_path

还可以从请求头中提取X-Source-ID来动态设置来源。

4.2 增加批量处理队列

如果要处理上百张图，不能一张张点“开始修复”。我们可以加个“批量导入”按钮，自动排队处理。

思路：

用户上传一个 ZIP 文件
解压后逐张读取
每张图用固定规则生成 mask（比如全图白色表示全部重绘）
依次调用run_inpaint
打包结果返回下载链接

示例代码片段：

import zipfile import shutil from pathlib import Path def batch_inpaint(zip_file): temp_dir = Path("temp_batch") output_zip = Path("outputs/batch_result.zip") with zipfile.ZipFile(zip_file.name, 'r') as z: z.extractall(temp_dir) with zipfile.ZipFile(output_zip, 'w') as z: for img_path in temp_dir.glob("*.png"): img = cv2.imread(str(img_path)) h, w = img.shape[:2] mask = np.ones((h, w), dtype=np.uint8) * 255 # 全图修复 result = run_inpaint(img, mask) result_path = f"outputs/{img_path.stem}_repaired.png" cv2.imwrite(result_path, result) z.write(result_path, arcname=f"repaired_{img_path.name}") shutil.rmtree(temp_dir) return output_zip

然后把这个函数绑定到一个新的 Gradio 组件上即可。

4.3 添加权限控制（登录验证）

默认谁都能访问 WebUI？这在生产环境不行。我们可以加个简单密码保护。

使用 Gradio 内置认证：

gr_app.launch( server_name="0.0.0.0", server_port=7860, auth=("admin", "your_password") # 添加用户名密码 )

启动后访问会弹出登录框，只有输入正确才能使用。

更高级的做法是接入 OAuth 或 JWT，适合企业级部署。

5. UI 界面定制：打造专属风格

不想用默认的“科哥出品”界面？完全可以自己改。

5.1 修改标题和LOGO

在app.py中找到 Gradio Blocks 定义：

with gr.Blocks(title="我的智能修图平台") as gr_app: gr.Markdown(""" # 我的智能修图平台 > 企业级图像修复系统 · 由AI驱动 """)

替换掉原来的标题和描述，甚至可以加公司LOGO图片：

![logo](file=assets/logo.png)

确保assets/logo.png存在即可。

5.2 调整布局颜色

Gradio 支持自定义 CSS：

css = """ .gradio-container { font-family: 'Microsoft YaHei', sans-serif; } #title { text-align: center; color: #1a73e8; } """ gr_app.launch(css=css, ...)

你还可以用theme="dark"切换暗色主题，提升专业感。

6. 性能优化建议

6.1 模型缓存避免重复加载

每次点击“开始修复”都重新加载模型？太慢了！

正确做法：全局加载一次

# 在文件顶部 model = None def get_model(): global model if model is None: model = load_lama_model() # 实际加载函数 return model

这样无论调用多少次，模型只加载一次，速度提升明显。

6.2 支持低分辨率预览模式

大图修复慢？可以先缩放预览。

def quick_preview(image, mask): h, w = image.shape[:2] if max(h, w) > 1000: scale = 1000 / max(h, w) small_img = cv2.resize(image, None, fx=scale, fy=scale) small_mask = cv2.resize(mask, None, fx=scale, fy=scale) result = run_inpaint(small_img, small_mask) return cv2.resize(result, (w, h)) # 放大回原尺寸（仅预览） else: return run_inpaint(image, mask)

用户可以选择“快速预览”或“高清修复”。

7. 部署与维护建议

7.1 使用 Docker 封装便于迁移

写个Dockerfile把整个环境打包：

FROM python:3.9 COPY . /app WORKDIR /app RUN pip install -r requirements.txt EXPOSE 7860 CMD ["bash", "start_app.sh"]

构建镜像：

docker build -t my-inpainting . docker run -d -p 7860:7860 my-inpainting

以后换服务器一键部署。

7.2 日志记录与错误监控

加个日志记录器，方便排查问题：

import logging logging.basicConfig( level=logging.INFO, format='%(asctime)s | %(levelname)s | %(message)s', handlers=[logging.FileHandler('logs/app.log')] ) # 使用示例 logging.info("用户开始修复图像 %s", filename)

定期清理旧日志，防止磁盘占满。

8. 总结：你已经掌握二次开发核心能力

8.1 回顾我们实现了什么

理解了项目结构：知道每个文件的作用，不再盲目修改
扩展了API接口：支持外部系统调用，打通业务流程
实现了功能定制：批量处理、命名规则、权限控制随心所欲
美化了UI界面：打造符合品牌形象的专业外观
优化了性能体验：模型缓存、预览模式提升响应速度
完善了部署方案：Docker + 日志，适合长期运行

8.2 下一步你可以做什么

把系统接入微信小程序，让用户拍照上传自动修复
对接电商平台，自动去除商品图背景水印
增加用户管理系统，不同角色权限隔离
加入计费功能，按调用次数收费
支持更多格式：PDF转图像再修复

只要你敢想，fft npainting lama就不只是个工具，而是你能掌控的图像智能引擎。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

fft npainting lama二次开发手册：接口扩展与功能定制详细步骤