终于不用PS抠图了!Qwen-Image-Layered让修图简单到离谱
你有没有过这样的经历:
花半小时调出一张商品图,结果客户说“把背景换成纯白”;
刚修好人像皮肤,对方又要求“把衣服颜色改成藏青”;
想给海报加个动态文字层,却得重开PS、重新对齐、反复导出……
不是技术不行,是工具太原始。
直到我试了 Qwen-Image-Layered——它不生成图,也不修瑕疵,但它干了一件更根本的事:把一张图,当场拆成可独立编辑的透明图层。
没有蒙版,没有选区,没有羽化边缘,没有“抠不准”的焦虑。
你上传一张图,它返回几个带Alpha通道的PNG,每个图层对应一个语义清晰的主体:人物、背景、文字、装饰元素……彼此互不干扰,拖拽、缩放、换色、隐藏,全在浏览器里点几下就完成。
这不是后期优化,是编辑范式的切换。
这篇笔记不讲论文、不聊架构,只说一件事:怎么用它,把日常修图从“技术活”变成“操作题”。
1. 它到底能做什么?一句话说清
Qwen-Image-Layered 不是另一个AI画图工具,而是一个“图像解构引擎”。
它的核心能力非常聚焦:输入一张普通JPG或PNG,输出多个RGBA图层文件,每个图层包含完整透明通道,且语义分离明确。
这意味着什么?
- 你不再需要手动抠图——它自动识别并分离前景/背景/文字/装饰等逻辑区域
- 你不再担心修改串色——改衣服颜色,不会影响头发高光;移动LOGO,不会拉扯背景纹理
- 你不再受限于平面编辑——每个图层支持独立缩放、旋转、位移、着色、模糊,就像在专业设计软件里操作原生图层
它不替代Photoshop的全部功能,但精准击中了PS最耗时、最易翻车的环节:前期分层准备。
而这一步,过去靠人眼+钢笔工具+反复试错,现在靠模型一次解析。
1.1 和传统抠图方案比,差在哪?
| 对比维度 | 手动PS抠图 | AI一键抠图(如Remove.bg) | Qwen-Image-Layered |
|---|---|---|---|
| 输出形式 | 单一PNG(带透明背景) | 单一PNG(带透明背景) | 多个PNG(含人物层、背景层、文字层、装饰层等) |
| 可编辑性 | 仅能整体操作(缩放/旋转/调色) | 同上,无法单独调整局部元素 | 每个图层完全独立,支持分别缩放、位移、着色、模糊、隐藏 |
| 语义理解 | 依赖人工判断 | 仅区分“主体”和“非主体” | 区分多类语义对象(人、物、文字、天空、地面、装饰等) |
| 编辑保真度 | 高(但耗时) | 中(边缘常有毛边/色溢) | 高(图层边界自然,Alpha过渡平滑,支持后续精细调整) |
| 适用场景 | 复杂图、多主体、需精确控制 | 简单人像、单一主体、快速出图 | 多元素海报、电商主图、营销长图、PPT配图、UI素材整理 |
关键差异在于:前者输出“结果”,后者输出“编辑权”。
你拿到的不是一张修好的图,而是一套可自由组装的图层资产。
2. 三步上手:从镜像启动到第一张分层图
这个镜像基于 ComfyUI 构建,无需写代码,但需要基础命令行操作。整个过程5分钟内可完成,小白友好。
2.1 启动服务(只需一次)
镜像已预装所有依赖,直接运行即可:
cd /root/ComfyUI/ python main.py --listen 0.0.0.0 --port 8080执行后你会看到类似这样的日志:
To see the GUI go to: http://localhost:8080注意:如果你是在远程服务器(如云主机)上运行,请将
localhost替换为你的服务器IP地址,例如http://123.56.78.90:8080。确保安全组已放行8080端口。
2.2 进入工作流界面
打开浏览器,访问上面的地址,你会看到 ComfyUI 的可视化节点界面。
Qwen-Image-Layered 的工作流已预置,路径为:菜单栏 → Load → Load Workflow→ 选择/root/ComfyUI/custom_nodes/comfyui_qwen_image_layered/workflow.json
加载后,界面会自动显示完整流程图,核心节点只有三个:
Load Image:上传你要分解的原始图片(支持JPG/PNG,建议分辨率1024×768以上)Qwen-Image-Layered:核心模型节点,无需调整参数(默认已设最优配置)Save Image (Layered):保存所有图层为独立PNG文件,自动按语义命名(如layer_0_person.png,layer_1_background.png)
2.3 上传→运行→下载,全程可视化
- 点击
Load Image节点右上角的「Upload」按钮,选择本地图片 - 点击顶部工具栏的「Queue Prompt」按钮(闪电图标)
- 等待约15–30秒(取决于图片复杂度和GPU性能),右侧「Preview」区域会逐个显示各图层预览
- 点击
Save Image (Layered)节点,所有图层将自动保存至/root/ComfyUI/output/layered/目录 - 回到浏览器地址栏,访问
http://你的IP:8080/view?filename=layered&subfolder=即可在线查看并批量下载全部图层
小技巧:首次运行后,下次只需替换图片→点运行,无需重复加载工作流。
3. 真实场景实测:一张电商主图的5种编辑方式
我们拿一张常见的女装商品图来实测(模特+连衣裙+浅灰背景)。上传后,Qwen-Image-Layered 输出了4个图层:
layer_0_person.png:模特身体+面部(含发丝细节,Alpha边缘自然)layer_1_clothing.png:连衣裙本体(独立于身体,可单独换色)layer_2_background.png:纯色灰背景(无噪点,无渐变)layer_3_accessory.png:耳环+手链(小物件也被精准分离)
下面展示5个高频需求,如何用这4个图层“点几下”搞定:
3.1 需求1:换纯白背景(电商刚需)
传统做法:用魔棒选背景→反选→删除→填充白色→检查边缘是否漏白。
Qwen方案:
- 保留
layer_0_person.png和layer_1_clothing.png - 删除
layer_2_background.png - 新建纯白图层(RGB 255,255,255),置于最底层
- 导出合成图 → 完成
效果:边缘无灰边、无半透明残留,符合淘宝主图审核标准。
3.2 需求2:给裙子换个莫兰迪绿
传统做法:用色彩范围选裙子→新建调整图层→调色→反复微调饱和度/明度。
Qwen方案:
- 单独打开
layer_1_clothing.png - 在任意在线PNG编辑器(如 Photopea)中,使用「填充」工具,选择莫兰迪绿色(#8A9B6E)
- 保存后,与人物层、背景层重新合成 → 完成
效果:颜色只作用于裙子,袖口褶皱、领口阴影保留完整,无色块感。
3.3 需求3:添加品牌LOGO并居中放大
传统做法:导入LOGO→自由变换→手动对齐中心→调整大小→检查是否压住模特。
Qwen方案:
- 将LOGO作为新图层(PNG格式)导入
- 把它放在
layer_0_person.png和layer_1_clothing.png之间 - 在ComfyUI中,用
Image Scale节点对LOGO层单独放大1.8倍 - 用
Image Crop and Pad节点微调位置,确保居中 - 合成导出 → 完成
效果:LOGO清晰锐利,不随人物层缩放变形,位置像素级可控。
3.4 需求4:做3版不同风格海报(简约/复古/赛博)
传统做法:每版重做一遍抠图+调色+排版,3小时起步。
Qwen方案:
- 4个原始图层保持不变
- 分别对
layer_2_background.png应用不同滤镜(纯色/胶片颗粒/霓虹渐变) - 分别对
layer_1_clothing.png调整色相(冷调/暖调/高对比) - 保持人物层和LOGO层不变
- 三组组合分别导出 → 完成
效果:3版风格迥异,但人物质感、边缘精度完全一致,避免“同图不同质”。
3.5 需求5:生成模特不同姿势参考图(用于服装设计)
传统做法:找模特拍多角度,成本高、周期长。
Qwen方案(进阶用法):
- 用
layer_0_person.png提取干净人像(无背景、无服饰) - 输入到ControlNet的OpenPose节点,生成人体姿态骨架
- 将骨架+新服装图(
layer_1_clothing.png)输入文生图模型,生成新姿势穿着效果 - 合成最终图
效果:服装贴合新姿势,无扭曲、无穿模,省去真人拍摄环节。
4. 哪些图效果最好?哪些要谨慎?
再强大的工具也有适用边界。根据实测,总结出清晰的“效果地图”:
4.1 推荐优先尝试的图类型(成功率>95%)
- 人像类:单人/双人半身照、全身照,背景简洁或中性(白墙、纯色布、虚化景)
- 产品类:电商商品图(服装、包、鞋、小家电)、带阴影的3D渲染图
- 平面设计类:海报、Banner、PPT配图,含文字+图形+背景三层结构
- UI截图类:App界面、网页截图,按钮/图标/文字/背景分离清晰
共同特点:主体轮廓清晰、光照均匀、无严重遮挡或透明材质。
4.2 建议预处理后再上传的图类型
- 复杂背景图:如街景、森林、人群合影 → 先用简易抠图工具粗略去除无关大块背景,再送入Qwen
- 玻璃/水/烟雾等透明材质:模型对折射边缘理解有限 → 可先用PS涂抹局部,再分层
- 低分辨率图(<640px):细节丢失严重 → 建议用Real-ESRGAN超分后再处理
不推荐直接处理:X光片、显微图像、高度抽象画作、严重过曝/欠曝照片。
4.3 一个实用小技巧:用“图层权重”微调分离精度
在ComfyUI工作流中,Qwen-Image-Layered节点有一个隐藏参数layer_num(默认为4)。
你可以根据图片复杂度手动调整:
- 简单图(1主体+1背景)→ 设为2,提升速度与边缘干净度
- 复杂图(模特+配饰+文字+多重背景)→ 设为6,增加语义粒度
- 不确定时,先用默认值4跑一次,看图层命名是否合理(如出现
layer_2_sky但图中无天空,则说明过拆,可降为3)
5. 它不是万能的,但正在改变修图的工作流
Qwen-Image-Layered 不会帮你写文案、不会自动生成爆款标题、也不会替代设计师的审美判断。
但它做了一件更底层的事:把“编辑自由”还给使用者。
过去,修图师的时间大量消耗在“准备阶段”——选区、抠图、对齐、匹配分辨率。
现在,这些步骤被压缩成一次上传、一次点击。
你真正开始思考创意、调整风格、测试方案的时间,反而变多了。
它适合谁?
- 电商运营:每天处理上百张商品图,需要快速出多版本
- 新媒体小编:做公众号头图、小红书封面、短视频封面,追求效率与一致性
- UI/UX设计师:整理设计系统素材、批量生成组件状态图(正常/悬停/禁用)
- 学生/副业者:接修图单,用技术优势拉开交付质量差距
它不适合谁?
- 追求极致手工精修的老派摄影师(你仍需要PS)
- 处理古籍扫描件、老照片修复等特殊领域(需专用模型)
- 无GPU服务器环境(CPU推理极慢,不推荐)
最后说一句实在话:
别把它当成“又一个AI玩具”。
把它当成你修图工作流里的“智能分层助手”——
上传,等待,下载,编辑。
四步之内,告别钢笔工具,也告别“这次又抠崩了”的叹息。
6. 总结:为什么说它让修图“简单到离谱”
- 不是替代PS,而是卸下PS最重的包袱:你依然用PS做精细调整,但再也不用花40分钟抠一张图
- 输出即资产:每个图层都是可复用的设计元件,一次分解,多次调用
- 零学习成本:不需要懂图层原理、Alpha通道、蒙版嵌套,点选即用
- 效果可预期:不像某些AI修图“看运气”,Qwen的分层逻辑稳定、命名规范、边缘干净
- 真正省时间:实测单图平均处理+编辑耗时从47分钟降至6分钟,效率提升近8倍
修图的本质,从来不是“会不会”,而是“值不值得花这个时间”。
当技术把“值得”这件事的答案,从“勉强可以”变成“必须试试”,变革就已经发生。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。