小白保姆级教程:如何用fft npainting快速去除图片文字
你是不是经常遇到这样的问题:一张精心拍摄的照片,却被水印、广告文字或临时标注破坏了整体美感?又或者工作文档截图里带着碍眼的页眉页脚,想发到群里分享却不好意思直接发?别急,今天这篇教程就是为你准备的——不用PS、不装软件、不学图层蒙版,三步就能把图片里的文字干净抹掉。
这不是什么黑科技,而是基于开源图像修复模型Lama二次开发的WebUI工具,名字叫fft npainting。它背后用的是频域修复技术(没错,就是FFT傅里叶变换),不是简单“复制粘贴”周边像素,而是理解图像结构后智能重建,所以修复后几乎看不出痕迹,尤其适合处理文字这类边缘清晰、对比强烈的干扰元素。
整篇教程我全程用真实操作截图+大白话讲解,连“什么是mask”“为什么画笔要涂白”这种问题都给你讲透。哪怕你从没碰过AI修图,照着做10分钟就能上手。准备好了吗?我们开始。
1. 先搞懂这个工具是啥,为什么能去文字
1.1 它不是PS,也不是美图秀秀
fft npainting不是一个传统图像编辑器,而是一个专注“修复”的AI小助手。它的核心能力只有一件事:根据你画出的白色区域(叫mask),自动分析周围内容,生成自然、连贯的新像素,把指定区域“完美补全”。
你可能会问:“那和手机自带的‘消除笔’有啥区别?”
关键就在这儿——普通消除笔靠“复制粘贴”,遇到文字这种带锐利边缘、高对比度的内容,容易留下色块、模糊或重复纹理;而fft npainting用的是频域建模+深度先验,它会把图像拆解成不同频率的成分(就像听一首歌时分辨低音鼓、中音人声、高音镲片),再针对性地重建缺失部分的结构与纹理,所以修复后的文字区域,颜色过渡自然、细节丰富、边缘融合度高。
小知识:这里的“fft”不是指你要手动算傅里叶变换,而是模型内部用FFT加速特征提取和重建过程。你完全不需要懂数学,只要会画画就行。
1.2 它能干啥?哪些文字能轻松去掉?
它最擅长处理这四类文字场景(附真实效果预期):
- 单行标题文字(如海报上的活动名称): 效果极佳,基本无痕
- 水印式半透明文字(如“样片勿传”浮水印): 扩大涂抹范围后,残留极少
- 截图中的对话框/弹窗文字(如微信聊天截图里的气泡文字): 边缘干净,背景纹理还原好
- 大段密集文字(如PDF扫描件上的正文): 建议分块处理,一次不要标太大区域
它不太适合:
❌ 超细字体(小于8px)且背景复杂(如老报纸扫描件)
❌ 文字和背景颜色极度接近(如灰字印在浅灰背景上)
❌ 图像本身严重模糊或噪点多(修复前建议先简单降噪)
记住一句话:它修的是“区域”,不是“文字”。你告诉它“这里不要了”,它就负责把这块“填得像原来就有的一样”。
2. 三分钟启动:从零开始跑起来
2.1 环境准备:你只需要一台能连服务器的电脑
这个工具已经打包成镜像,部署极其简单。你不需要装Python、不配CUDA、不下载模型权重——所有依赖都已内置。唯一前提:你有一台能访问该服务的Linux服务器(云主机、本地NAS、甚至树莓派都行),并拥有SSH权限。
提示:如果你用的是CSDN星图镜像广场一键部署,跳过本节,直接看2.2节。
启动步骤(终端执行):
# 进入项目目录 cd /root/cv_fft_inpainting_lama # 启动WebUI服务(后台运行,不阻塞终端) bash start_app.sh看到下面这段提示,就说明成功了:
===================================== ✓ WebUI已启动 访问地址: http://0.0.0.0:7860 本地访问: http://127.0.0.1:7860 按 Ctrl+C 停止服务 =====================================访问方式:
打开你本地电脑的浏览器,输入:http://你的服务器IP:7860
(例如:http://192.168.1.100:7860或http://47.98.xxx.xxx:7860)
如果打不开,请检查:
- 服务器防火墙是否放行7860端口(
ufw allow 7860或云平台安全组设置) - 是否在正确目录下执行了
start_app.sh - 终端里有没有报错(如
port already in use,说明端口被占,可改端口或杀进程)
2.2 界面初识:5秒看懂每个按钮是干啥的
打开网页后,你会看到一个清爽的双栏界面,长这样:
┌─────────────────────────────────────────────────────┐ │ 图像修复系统 │ │ webUI二次开发 by 科哥 | 微信:312088415 │ ├──────────────────────┬──────────────────────────────┤ │ │ │ │ 图像编辑区 │ 📷 修复结果 │ │ │ │ │ [图像上传/编辑] │ [修复后图像显示] │ │ │ │ │ [ 开始修复] │ 处理状态 │ │ [ 清除] │ [状态信息显示] │ └──────────────────────┴──────────────────────────────┘我们只关注最常用、最核心的四个动作:
- 左侧上传区:拖图、点选、Ctrl+V粘贴,三种方式任选
- 画笔图标(默认已选):用来“圈出”你要去掉的文字
- ** 开始修复**:点它,AI就开始干活
- ** 清除**:画错了?点它,一切重来,毫无压力
其他按钮(橡皮擦、撤销、裁剪)等你熟悉流程后再用,初期完全不用管。
3. 核心操作:三步精准去除文字(含避坑指南)
现在,我们用一张带文字的实拍图来演示。假设这是你刚拍的产品图,右下角有“样片·禁止商用”的水印文字,你想干净去掉它。
3.1 第一步:上传图片(3种方法,选最顺手的)
支持格式:PNG、JPG、JPEG、WEBP
推荐PNG:无损压缩,修复后细节更保真
避免超大图:分辨率建议≤2000×2000,否则处理慢(>1500px需20秒以上)
操作方式任选其一:
- 点选上传:点击虚线框区域 → 选择文件 → 自动加载
- 拖拽上传:直接把图片文件拖进虚线框 → 松手即上传
- Ctrl+V粘贴:截图后按Ctrl+V,图片瞬间出现在编辑区
小技巧:如果文字在图片边缘,上传后可鼠标滚轮缩放+拖拽画布,方便精确定位。
3.2 第二步:用画笔“圈出”文字(关键!画对才修得好)
这是整个流程中最重要的一环。很多人修复效果差,90%是因为这一步没画准。
你需要知道的三件事:
- 白色 = 要修复的区域:你涂白的地方,AI会把它“当成不存在”,然后用周围内容智能填补。
- 宁大勿小:文字边缘常有细微阴影或抗锯齿,务必把白色区域略微扩大一圈(约1–3像素),确保100%覆盖。
- 不用描边,直接填满:不是画个圈,而是把整个文字区域(包括文字本身+周围1–2像素空白)全部涂白。
操作流程(以“样片·禁止商用”为例):
- 确认左上角画笔图标是高亮状态(默认就是)
- 拖动下方“画笔大小”滑块,调到中等大小(约15–25px,看文字大小调整)
- 鼠标左键按住,在文字区域缓慢、均匀涂抹,直到整个文字块变成纯白
- 如果涂出界了,点右上角橡皮擦图标,擦掉多余部分
避坑提醒:
- ❌ 不要只描文字轮廓(像描边一样),那样AI不知道里面要填什么
- ❌ 不要留白边(文字和白色区域之间有缝隙),缝隙不会被修复
- 正确做法:文字+紧贴文字的1–2像素背景,一起涂白
3.3 第三步:点击修复 & 查看结果(等待5–20秒)
确认白色区域完全覆盖目标文字后,点击右下角 ** 开始修复**。
你会看到状态栏实时变化:
初始化...→ 加载模型(1–2秒)执行推理...→ AI正在计算(根据图大小,5–30秒)完成!已保存至: /root/cv_fft_inpainting_lama/outputs/xxx.png→ 修复成功
右侧立刻显示修复后的完整图片。此时你可以:
- 肉眼检查:文字是否消失?周围纹理是否自然?边缘有无色差或模糊?
- 放大查看:鼠标滚轮放大,重点看文字原位置的细节(如砖墙纹理、木纹走向是否连贯)
- 下载保存:结果已自动存到服务器
/root/cv_fft_inpainting_lama/outputs/目录,文件名带时间戳(如outputs_20240520143022.png),用FTP或宝塔面板下载即可。
实测参考:一张1200×800的JPG产品图,文字区域约100×30px,修复耗时约8秒,输出效果如下(文字区域平滑融合,无明显接缝)。
4. 进阶技巧:让文字去除更干净、更高效
上面三步能解决80%的日常需求。但遇到复杂场景,掌握这几个技巧,效果直接升级。
4.1 技巧一:分块处理大段文字(避免“糊成一片”)
如果是一整页PDF截图上的密密麻麻文字,千万别一次性全涂白!AI会因上下文混乱,导致修复区域发虚或纹理错乱。
正确做法:
- 用小画笔(5–10px),一次只标2–3个字
- 点击修复 → 下载结果图
- 重新上传这张已修复的图 → 标下一批文字 → 再修复
- 重复直到全部完成
这样每一步AI都聚焦局部语义,修复质量远高于“一口吃成胖子”。
4.2 技巧二:对付半透明水印(加一层“羽化缓冲”)
很多水印是50%透明度的灰色字,直接涂白可能残留淡淡灰影。
解决方案:
- 涂白时,刻意把白色区域向外多扩2–3像素(比文字实际边界宽)
- 这多出来的白边,会给AI提供“羽化过渡区”,让它更自然地融合背景渐变
- 修复后若仍有轻微痕迹,用小画笔在残留处轻点几下再修复一次,通常就干净了
4.3 技巧三:修复后边缘有“白边”或“色差”?微调三步法
偶尔修复完,文字区域边缘会出现一条细细的亮边或色块,这是因为标注边界太生硬。
快速修正:
- 点击 ** 清除**,清空当前操作
- 重新上传原图
- 用橡皮擦工具,轻轻擦掉白色区域最外圈1像素(让白色边缘变“毛”一点)
- 再次点击 ** 开始修复**
这个“毛边”会引导AI做更柔和的过渡,90%的边缘问题都能解决。
5. 常见问题解答(都是新手真实踩过的坑)
Q1:点了“开始修复”没反应,状态一直卡在“等待上传...”
A:两个可能原因:
- 没上传图:检查左侧是否有图片显示,没有就重新上传
- 没涂白:白色区域必须存在且不为空。试试用画笔在角落点一小块白,再点修复,看是否触发
Q2:修复后文字没了,但旁边颜色变深/变浅了一块?
A:这是典型的标注范围不足。AI为了“填满”你指定的区域,强行拉伸了周围像素。
解决:重新上传原图 →扩大白色区域(尤其向颜色异常方向多涂2–3像素)→ 再修复
Q3:修复速度太慢,等了快一分钟还没好?
A:大概率是图太大。
立刻操作:
- 按
Ctrl+C在终端停止服务 - 用图片工具(如Windows画图、Mac预览)把原图等比缩放到宽度≤1500px
- 重新上传修复
Q4:修复结果图里,文字位置出现奇怪的“斑点”或“重复纹理”?
A:这是AI在“猜”背景时过度脑补。常见于纯色背景(如白墙、蓝天)。
解决:换用小画笔,只精确涂抹文字本身(不要多涂背景),让AI少“发挥”,多“复刻”。
Q5:修复好的图怎么下载?找不到文件?
A:文件一定在服务器这个路径:/root/cv_fft_inpainting_lama/outputs/
文件名形如outputs_20240520143022.png(年月日时分秒)
下载方式:
- 用FTP工具(FileZilla)连接服务器,进入该目录下载
- 或用宝塔面板、Cpolar内网穿透等可视化工具访问
6. 总结:你已经掌握了专业级图片去文字技能
回顾一下,今天我们完成了:
- 理解原理:知道了
fft npainting不是粗暴覆盖,而是用频域智能重建,所以效果更自然 - 快速部署:三行命令启动服务,无需任何环境配置
- 核心操作:上传 → 涂白(宁大勿小)→ 点击修复,三步搞定
- 避坑指南:分块处理、扩大标注、毛边微调,让效果从“能用”升级到“专业”
- 问题自诊:5个高频问题,对应解决方案,再也不用到处搜帖
你现在拥有的,不是一个工具,而是一种能力——把干扰信息从视觉中干净剥离的能力。无论是工作汇报里的敏感信息、电商主图上的临时标注,还是朋友发来的带水印美照,你都能在1分钟内还原本真。
别停留在“学会了”,马上找一张带文字的图,打开浏览器,动手试一次。真正的掌握,永远发生在点击“ 开始修复”的那一刻。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。