手把手教你用FLUX.1+SDXL生成惊艳图片:小白友好教程
你是不是也试过这样:对着Stable Diffusion输入一大段提示词,满怀期待点下生成,结果——人物手长出六根手指、建筑歪斜像被风吹歪的积木、猫的尾巴连在屋顶上……不是模型不行,而是你还没摸清它的“脾气”。
今天这篇教程,不讲参数、不聊架构、不堆术语。我们就用镜像FLUX.1-dev-fp8-dit文生图+SDXL_Prompt风格,在ComfyUI里,从打开软件到导出第一张高清图,全程无断点、无跳步、不绕弯。哪怕你昨天才第一次听说“文生图”,今天也能稳稳跑通整条流程,生成一张自己真正想看到的画面。
它不依赖你懂Python,不需要改配置文件,更不用查显存报错日志。只要你会复制粘贴、会点鼠标、会看中文界面,就能跟着一步步做出效果——而且是那种让人忍不住截图发朋友圈的“哇”级效果。
准备好了吗?我们直接开始。
1. 先别急着装模型:确认你的电脑“够格”
很多新手卡在第一步,不是不会操作,而是硬件没达标,硬装只会反复报错、浪费时间。咱们先花2分钟,快速判断你的设备能不能跑起来。
1.1 三秒自测清单(请对照你的电脑)
- 显卡是NVIDIA RTX 3060(12GB)或更高?(RTX 4060、4070、4080、4090都行;GTX系列、AMD显卡、Mac M系列芯片暂不支持)
- 内存 ≥16GB?(32GB更顺,但16GB可运行)
- 硬盘剩余空间 ≥50GB?(模型+缓存+临时文件,留足余量)
- 操作系统:Windows 10/11 或 macOS(Intel/M1/M2,需Rosetta 2)或 Ubuntu 22.04+
特别注意:FLUX.1-dev 使用 fp8 量化和 DiT 架构,必须依赖 NVIDIA Ampere 及以上架构显卡(即RTX 30系起)。老款GTX 1080、1660等无法启用核心计算指令,强行加载会直接崩溃。
如果你的显卡是RTX 3060或更高,恭喜——你已拿到入场券。接下来所有步骤,我们都按“最简路径”设计,不走命令行,不碰虚拟环境,不折腾驱动。
2. 一键启动ComfyUI:5分钟进工作流界面
我们不推荐从GitHub源码手动部署(对新手太不友好),而是用官方维护的桌面版ComfyUI——它把Python、PyTorch、CUDA全打包好了,双击就开。
2.1 下载与安装(Windows为例)
- 打开浏览器,访问:
https://github.com/comfyanonymous/ComfyUI/releases - 向下滚动,找到最新版(如
v0.3.27),下载带Desktop_CUDA124的安装包:- 文件名类似:
ComfyUI_Desktop_CUDA124_v0.3.27.exe
- 文件名类似:
- 双击运行,按提示安装(默认路径即可,无需修改)
- 安装完成后,桌面会出现图标:
ComfyUI Desktop
小技巧:安装时勾选“添加到开始菜单”和“创建桌面快捷方式”,后续启动更方便。
2.2 首次启动与界面初识
双击图标,你会看到一个黑色命令行窗口闪一下,然后自动弹出浏览器标签页(地址:http://127.0.0.1:8188)。
这就是ComfyUI主界面——一个空白画布,左侧是节点列表,中间是工作区,右侧是预览面板。
此时你已成功进入环境!不需要任何额外配置。
提示:如果浏览器没自动打开,手动复制粘贴
http://127.0.0.1:8188到Chrome/Firefox/Edge中即可。
3. 加载镜像工作流:两步到位,不迷路
本镜像名称为:FLUX.1-dev-fp8-dit文生图+SDXL_Prompt风格
它不是一个“要你手动拼”的复杂流程,而是一个预置好的、开箱即用的工作流,专为FLUX.1-dev优化,且内置了SDXL风格提示词增强逻辑。
3.1 找到并加载工作流
在ComfyUI界面左上角,点击“Load Workflow”(加载工作流)按钮
在弹出窗口中,选择镜像自带的预设文件:
→ 文件名通常为:FLUX.1-dev-fp8-dit文生图+SDXL_Prompt风格.json
(若未显示,请点击右上角“”图标切换到镜像安装目录下的workflows/文件夹)点击确定,工作流将自动加载到画布中央。
你会看到一组整齐排列的节点,其中最显眼的是两个关键组件:
FLUX.1-dev-fp8-dit:主模型加载器(已预设好路径,无需你填)SDXL Prompt Styler:智能提示词增强节点(重点!后面细说)
验证是否加载成功:
- 所有节点连线完整,无红色报错;
- 左侧节点栏中,“CheckpointLoaderSimple”下方应显示
flux1-dev-fp8-dit.safetensors;- “CLIPTextEncode”节点旁应有绿色小圆点,表示文本编码器已就绪。
4. 核心操作:写提示词 + 选风格 = 生成好图的关键
很多人以为“提示词越长越好”,其实不然。FLUX.1-dev配合这个镜像,真正厉害的地方在于:它能读懂你“没说全”的意思,并自动补全专业表达。
而这一切,靠的就是SDXL Prompt Styler这个节点。
4.1 什么是SDXL Prompt Styler?
它不是简单的“加形容词”,而是一个轻量级风格引擎:
你输入日常语言(比如“一只橘猫坐在窗台上晒太阳”),它会自动识别主体、场景、光影、风格倾向,并叠加SDXL训练中高频出现的专业描述词(如“cinematic lighting, soft focus, detailed fur, warm ambient light”),大幅提升画面质感。
更重要的是——它支持一键切换风格,不用重写提示词。
4.2 实操:三步写出高质量提示词
我们以生成一张“赛博朋克风城市夜景”为例:
在
SDXL Prompt Styler节点中,点击输入框,输入基础描述:neon-lit city street at night, flying cars, holographic ads, rain-wet pavement, cyberpunk style点击右侧下拉菜单,选择一个风格模板(推荐新手从这几个开始):
Cinematic:电影感强,适合大场景、氛围渲染Photorealistic:照片级真实,细节丰富,适合产品/人像Anime:日系动漫风,线条清晰,色彩明快Concept Art:概念设计风,粗犷有力,适合前期构思
本次选
Cinematic(可选)在负向提示框中,填入你不想看到的内容:
deformed, blurry, text, logo, watermark, extra limbs, bad anatomy
小贴士:
- 不用纠结语法,用逗号分隔关键词即可;
- 中文、英文混输完全没问题(本镜像已适配中文CLIP tokenizer);
- 风格模板不是“滤镜”,而是语义增强逻辑,选错也不会崩图,只是效果倾向不同。
5. 图片设置与生成:尺寸、数量、质量一次定
工作流里有两个关键调节项,直接影响输出效果和速度:
5.1 选择图片尺寸(比你想的更简单)
节点中有一个名为ImageSizeSelector的模块,点击它,你会看到常用尺寸选项:
| 尺寸选项 | 像素尺寸 | 适用场景 |
|---|---|---|
SDXL Default | 1024×1024 | 通用平衡,推荐新手首选 |
Portrait | 832×1216 | 人像、角色立绘、手机壁纸 |
Landscape | 1216×832 | 风景、海报、横幅广告 |
Ultra HD | 1344×768 | 社交平台首图(如小红书/微博封面) |
新手建议先选SDXL Default,稳定不出错,生成速度快。
5.2 设置生成参数(三参数就够用)
在KSampler节点中,只需调整三个值(其余保持默认):
| 参数 | 推荐值 | 说明 |
|---|---|---|
Steps(步数) | 20 | 少于18易模糊,超过25提升有限,20是黄金平衡点 |
CFG Scale(提示词引导强度) | 3.5 | 太低(<2.5)→ 忽略提示;太高(>5)→ 生硬刻板;3.5最自然 |
Sampler(采样器) | euler_a | FLUX.1-dev实测最稳、最快、最兼容的采样器 |
无需调
Denoise、Scheduler等高级参数——本镜像已针对fp8量化做过预优化,保持默认即可。
6. 点击生成:等待15秒,收获第一张惊艳图
确认所有设置无误后:
- 点击画布顶部的“Queue Prompt”(排队生成)按钮
- 右侧预览区会显示进度条,同时下方日志显示:
Running... [FLUX.1-dev-fp8-dit] Sampling step 1/20 - 约12–18秒后(RTX 4090约12秒,3090约15秒,3060约18秒),图片自动出现在预览区
成功标志:
- 预览图清晰、无马赛克、无明显畸变;
- 主体符合提示词描述(如“飞车”真在天上,“霓虹广告”真有发光字);
- 光影自然,没有大面积死黑或过曝。
第一张图可能不够完美,但请记住:这是你和FLUX.1-dev的第一次对话。它正在学习你的语言习惯。多试2–3次,微调提示词,效果会肉眼可见地提升。
7. 效果优化:让图更“对味”的4个实用技巧
生成完第一张图,你可能会想:“不错,但还差点感觉。”别急,这4个技巧,普通人3分钟就能学会,效果立竿见影。
7.1 技巧1:换风格不重写,一秒切换
刚才选了Cinematic,现在想看看Photorealistic效果?
→ 直接回到SDXL Prompt Styler节点,下拉菜单换选项,再点一次Queue Prompt。
无需改提示词,无需重载模型,全程10秒内完成。
7.2 技巧2:局部微调,只重绘想要的部分
比如生成后发现“飞车太小”,但背景很好不想重来?
→ 使用Inpaint模式(本镜像已预置):
1. 在预览图上用鼠标圈出飞车区域;
2. 在Inpaint Prompt输入框中写:large futuristic flying car, glowing engine;
3. 点击生成,仅该区域重绘,其余保持原样。
7.3 技巧3:提升细节,加一个“放大器”
默认输出是1024×1024,但你想发高清公众号?
→ 找到工作流末尾的UltimateSDUpscale节点:
- 勾选Enable Upscale;
- 选择ESRGAN_4x(通用强、速度快)或SwinIR_4x(细节更锐利);
- 再次生成,输出即为4096×4096超清图,纹理、毛发、文字边缘全部清晰。
7.4 技巧4:批量生成,一次出5张不同版本
想对比哪种风格/构图更好?
→ 修改KSampler中的Batch Size为5;
→ 点击生成,一次输出5张图(提示词相同,随机种子不同);
→ 在预览区横向滑动查看,挑最满意的一张保存。
所有这些操作,都不需要你写代码、不重启软件、不重新加载模型。ComfyUI的可视化逻辑,就是为这种“所见即所得”的迭代而生。
8. 保存与导出:你的作品,随时带走
生成图自动显示在右侧预览区。保存方法极简:
- 将鼠标悬停在预览图上,右下角出现工具栏
- 点击💾 保存图标(或按快捷键
Ctrl+S/Cmd+S) - 选择保存位置(默认在
ComfyUI/output/文件夹) - 文件名自动带时间戳,格式为
.png(无损透明支持)
补充说明:
- 所有生成图均保存为PNG,支持Alpha通道(适合后期PS合成);
- 原始提示词、参数设置、工作流版本,会一并记录在同名
.txt文件中,方便复现;- 若需JPG格式,用任意看图软件打开PNG另存为JPG即可。
9. 常见问题速查:遇到报错,30秒定位解决
新手最怕红字报错。以下是本镜像高频问题及“一句话解法”:
| 现象 | 最可能原因 | 30秒解决法 |
|---|---|---|
| 点击生成后无反应,日志空白 | ComfyUI服务未启动 | 关闭软件,重新双击桌面图标 |
| 提示“Node not found: SDXL Prompt Styler” | 工作流加载不全 | 重新加载.json文件,或重启ComfyUI |
| 生成图全黑/全灰 | 提示词含冲突描述(如“白天”+“霓虹灯”) | 删除矛盾词,或加权重:(neon-lit:1.3) |
| 图片有奇怪色块/线条 | 显存不足或fp8精度异常 | 降低尺寸至832×1216,或在CheckpointLoader中关闭fp8选项 |
| 中文提示词不生效 | 未启用中文CLIP | 在SDXL Prompt Styler下方勾选Enable Chinese CLIP |
所有问题,都不需要重装、不需查日志、不需改代码。90%可通过“重载工作流+换尺寸+换风格”三步化解。
10. 下一步怎么走?从会用到用好
你现在已掌握:环境启动 → 工作流加载 → 提示词输入 → 风格切换 → 参数设置 → 一键生成 → 保存导出。这是绝大多数创作者每天用到的全部操作。
但如果你想走得更远,这里给你三条清晰路径:
- 想更快出图?→ 学习使用
Prompt History(提示词历史),收藏常用组合,下次直接调用; - 想控制构图?→ 尝试工作流中隐藏的
ControlNet Switcher节点,接入线稿/姿态图做精准引导; - 想批量生产?→ 启用
Batch Prompt功能,用CSV表格导入100条提示词,全自动跑完。
但请一定记住:最好的学习,永远发生在你按下“Queue Prompt”的下一秒。
不要等“学完所有再动手”,你的第一张图,就是最好的起点。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。