news 2025/12/30 7:31:14

AI发烧友_「一句话改姿势」:用中文指令精准编辑人物动作的 ComfyUI 工作流(基于 Qwen-VL和QwenImageEdit)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI发烧友_「一句话改姿势」:用中文指令精准编辑人物动作的 ComfyUI 工作流(基于 Qwen-VL和QwenImageEdit)

「一句话改姿势」:用中文指令精准编辑人物动作的 ComfyUI 工作流(基于 Qwen-VL和QwenImageEdit)

阅读原文

建议阅读原文,始终查看最新文档版本,获得最佳阅读体验:《「一句话改姿势」:用中文指令精准编辑人物动作的 ComfyUI 工作流(基于 Qwen-VL和QwenImageEdit)》

https://docs.dingtalk.com/i/nodes/nYMoO1rWxa7nvZ7Gu0G16n3RV47Z3je9

前言

“把人物改成双手像猫咪一样握拳放在脸边,要可爱!”
——过去这需要 PS + ControlNet + 多轮调试;
现在,只需一行中文提示,AI 自动精准完成!

最近,通义千问推出的Qwen-Image 系列模型在 AIGC 圈掀起热潮。而今天我要分享的,是一个基于Qwen-VL 多模态大模型 + Qwen-Image-Edit 扩散模型ComfyUI 高级图像编辑工作流——它能真正理解你的自然语言指令,快速便利地调整图片中人物的姿势,而且一次可以批量生成多种姿势的图片。


真实示例

我使用的GPU是NVIDIA Quadro RTX 5000 16GB

上传图片:

生成的图片:

可以看到,人物一致性非常好,背景也保持了一致性。

人物的姿势动作都可以调整的,直接用自然语言描述即可。

视频演示

哔哩哔哩: https://player.bilibili.com/player.html?autoplay=false&bvid=BV1dumMBNEKL

🔥 它能做什么?看这些例子就知道了

上传一张普通人像照片,然后告诉 AI:

  • “变成俯视拍摄,单眼眨眼”

  • “手臂向前伸展,比出 V 字手势”

  • “跪地姿势,带上黑色墨镜”

  • “双手模仿猫咪握拳的姿态放在脸侧,显得俏皮可爱”

✅ 姿势精准
✅ 身份一致
✅ 背景保留
✅ 无肢体畸变

这一切,无需 ControlNet 姿态图、无需 IP-Adapter 参考、无需手动标注——全靠一句中文!


🧠 技术揭秘:为什么它这么聪明?

传统 Stable Diffusion 的图像编辑依赖“文本+参考图+控制图”的拼凑,而本工作流采用端到端多模态理解架构

模块作用
Qwen-VL-7B(视觉语言大模型)同时“看懂”原图 + “听懂”你的指令,生成精准编辑意图
Qwen-Image-Edit(FP8 量化 UNet)高效执行编辑,在保持画质的同时大幅降低显存
自定义节点**TextEncodeQwenImageEditPlus**将多模态理解结果注入扩散过程,实现像素级可控

💡 简单说:Qwen-VL 是“大脑”,Qwen-Image-Edit 是“手”——一个负责理解,一个负责执行。


🛠️ 使用要求 & 显存建议

  • 必需模型(需手动下载):

    • Qwen-Image-Edit-2509_fp8_e4m3fn.safetensorsmodels/diffusion_models/

    • qwen_image_vae.safetensorsmodels/vae/

    • qwen_2.5_vl_7b_fp8_scaled.safetensorsmodels/text_encoders/

    • LoRA(如Qwen Edit百变姿势.safetensors)→models/loras/

  • 显存建议

    • 768×768 分辨率:≥16GB VRAM(RTX 3090 / 4080 可运行)

    • 1024×1024 分辨率:推荐 24GB(RTX 4090 / 3090)

⚠️ 注意:因使用 Qwen-VL-7B,低于 12GB 显存的设备难以运行。可启用--lowvram模式尝试降分辨率。


ComfyUI workflow下载

请至钉钉文档查看附件《人物多姿势一致性.json》

ComfyUI的日志

从日志中可以看出,此次执行workflow,总共花费了1小时8分钟,这确实很久,这是因为我用的是GPU(NVIDIA Quadro RTX 5000 16GB)不是很高端的,而且一次性批量生成了16张图片,所以时间很长。

got prompt WARNING: ProcessString.IS_CHANGED()got an unexpected keyword argument'input_string'Requested to load WanVAE loaded completely;3298.56MB usable,242.03MB loaded, full load: True Requested to load QwenImageTEModel_ loaded completely;14190.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Unloaded partially:5057.24MB freed,2852.50MB remains loaded,194.25MB buffer reserved, lowvram patches:0loaded completely;14180.46MB usable,7909.74MB loaded, full load: True Requested to load QwenImage loaded partially;12906.95MB usable,11497.74MB loaded,7986.21MB offloaded,1404.01MB buffer reserved, lowvram patches:580100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:56<00:00,29.57s/it]loaded partially;12892.95MB usable,11488.73MB loaded,7995.21MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.95s/it]loaded partially;12883.95MB usable,11479.74MB loaded,8004.21MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:57<00:00,29.65s/it]loaded partially;12856.95MB usable,11452.73MB loaded,8031.22MB offloaded,1404.01MB buffer reserved, lowvram patches:3100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:58<00:00,29.82s/it]loaded partially;12829.94MB usable,11425.73MB loaded,8058.22MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:57<00:00,29.73s/it]loaded partially;12802.94MB usable,11398.73MB loaded,8085.22MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:57<00:00,29.74s/it]loaded partially;12775.94MB usable,11371.73MB loaded,8112.22MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.91s/it]loaded partially;12748.94MB usable,11344.72MB loaded,8139.23MB offloaded,1404.01MB buffer reserved, lowvram patches:3100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:58<00:00,29.77s/it]loaded partially;12721.93MB usable,11317.72MB loaded,8166.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.93s/it]loaded partially;12694.93MB usable,11290.72MB loaded,8193.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.90s/it]loaded partially;12667.93MB usable,11263.72MB loaded,8220.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.90s/it]loaded partially;12640.93MB usable,11236.71MB loaded,8247.23MB offloaded,1404.01MB buffer reserved, lowvram patches:3100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[04:00<00:00,30.06s/it]loaded partially;12613.92MB usable,11209.71MB loaded,8274.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:59<00:00,29.91s/it]loaded partially;12586.92MB usable,11182.71MB loaded,8301.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:58<00:00,29.82s/it]loaded partially;12559.92MB usable,11155.71MB loaded,8328.23MB offloaded,1404.01MB buffer reserved, lowvram patches:1100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[04:00<00:00,30.02s/it]loaded partially;12532.92MB usable,11128.71MB loaded,8355.24MB offloaded,1404.01MB buffer reserved, lowvram patches:3100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|8/8[03:57<00:00,29.66s/it]Requested to load WanVAE Unloaded partially:11137.62MB freed, -8.92 MB remains loaded,2106.05MB buffer reserved, lowvram patches:858loaded completely;977.41MB usable,242.03MB loaded, full load: True Prompt executedin01:08:45

-8.92 MB remains loaded, 2106.05 MB buffer reserved, lowvram patches: 858
loaded completely; 977.41 MB usable, 242.03 MB loaded, full load: True
Prompt executed in 01:08:45

![梦幻智能logo-01(无水印).png](https://i-blog.csdnimg.cn/img_convert/45b39512a569d56f3bae37d44f662657.png)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/11 20:21:45

华恒智信助力某大型制造人力资源管理咨询服务项目改革

近日&#xff0c;由北京华恒智信专家团队与某大型生产制造企业共同推动的绩效考核体系改革项目取得阶段性成果。双方通过系统收集考核数据、专项开发考核工具及组织多层次培训&#xff0c;标志着新绩效管理体系已步入落地执行的关键时期。该企业作为行业重要力量&#xff0c;长…

作者头像 李华
网站建设 2025/12/11 20:21:13

VSCode中搭建量子计算开发环境的完整教程(仅需30分钟)

第一章&#xff1a;VSCode中搭建量子计算开发环境的完整教程&#xff08;仅需30分钟&#xff09; 在现代软件开发中&#xff0c;量子计算正逐步从理论走向实践。Visual Studio Code&#xff08;VSCode&#xff09;凭借其强大的扩展生态&#xff0c;成为搭建轻量级量子开发环境的…

作者头像 李华
网站建设 2025/12/21 16:32:01

学员爆单,靠AI月入2w+

昨晚有个粉丝给我留言&#xff0c;语音里满是焦虑&#xff1a;独孤&#xff0c;我想靠做课件 PPT 赚钱。可是我不会设计&#xff0c;也不会排版。有没有那种一键出爆款&#xff0c;又不要花钱&#xff0c;最好还能教我怎么做的工具&#xff1f;我笑了。你看&#xff0c;这就是典…

作者头像 李华
网站建设 2025/12/11 20:19:58

X-CLIP多模态模型配置与视频理解AI实战指南

X-CLIP多模态模型配置与视频理解AI实战指南 【免费下载链接】xclip-base-patch32 项目地址: https://ai.gitcode.com/hf_mirrors/microsoft/xclip-base-patch32 X-CLIP是微软开发的多模态AI模型&#xff0c;专门用于视频理解任务。该项目基于CLIP架构扩展&#xff0c;支…

作者头像 李华
网站建设 2025/12/11 20:19:11

Wan2.2-T2V-A14B支持水印自动嵌入功能吗?版权保护增强

Wan2.2-T2V-A14B 支持水印自动嵌入吗&#xff1f;版权保护的“隐形防线”真的存在吗&#xff1f; 在AI视频生成正以肉眼可见的速度重塑内容产业的今天&#xff0c;一个看似不起眼、却关乎生死的问题浮出水面&#xff1a;我生成的这段视频&#xff0c;到底算谁的&#xff1f; 你…

作者头像 李华