news 2026/4/23 15:54:53

ComfyUI图文教程:一步步教你点击【运行】生成第一张图

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ComfyUI图文教程:一步步教你点击【运行】生成第一张图

ComfyUI图文教程:一步步教你点击【运行】生成第一张图

1. 引言

随着AI生成技术的快速发展,越来越多用户希望以更直观、高效的方式构建图像生成流程。ComfyUI作为一款基于节点式工作流设计的图形化工具,凭借其可视化操作界面高度可定制性,成为众多AI绘画爱好者的首选平台。

本教程面向初学者,旨在通过清晰的操作步骤与图文指引,帮助你从零开始,在ComfyUI中完成第一个图像生成任务。无论你是刚接触Stable Diffusion生态的新手,还是希望提升工作流管理效率的进阶用户,本文都能为你提供实用的入门路径。

学习目标包括:

  • 理解ComfyUI的核心设计理念
  • 掌握基本界面布局与功能模块
  • 完成一次完整的“输入提示词 → 运行 → 查看结果”流程

前置知识建议:了解Stable Diffusion的基本概念(如Prompt、模型加载等)将有助于更快上手,但非必需。


2. ComfyUI简介

2.1 什么是ComfyUI?

ComfyUI是一款专为Stable Diffusion设计的基于节点的工作流引擎,允许用户通过拖拽和连接不同功能模块(即“节点”),构建复杂的图像生成逻辑。相比传统的WebUI界面,它提供了更高的灵活性和控制精度。

2.2 核心特性

ComfyUI之所以受到开发者和创作者青睐,主要得益于以下六大优势:

  • 基于工作流节点设计:每个处理环节(如文本编码、图像采样、VAE解码)都封装为独立节点,支持自由组合。
  • 可视化工作流搭建:无需编写代码,即可通过图形界面完成复杂逻辑编排。
  • 快速切换工作流:保存多个预设工作流模板,一键切换不同风格或用途的生成方案。
  • 显存占用小、运行速度快:优化的内存调度机制,适合中低配GPU设备运行。
  • 支持主流插件扩展
    • ADetailer:自动增强人脸或细节区域
    • ControlNet:实现姿态、边缘、深度图引导生成
    • AnimateDiff:生成动态视频帧序列
  • 社区活跃,生态丰富:大量开源工作流模板可供下载复用。

这些特性使得ComfyUI不仅适用于静态图像生成,还能轻松拓展至动画制作、条件控制、批量处理等高级场景。


3. 使用说明:六步生成你的第一张图

本节将带你完整走通一次图像生成流程,涵盖从进入系统到查看输出结果的所有关键步骤。每一步均配有截图说明,确保操作无误。

3.1 Step 1:进入ComfyUI模型显示入口

首先启动ComfyUI服务后,在浏览器中访问其Web界面。默认地址通常为http://localhost:8188

如下图所示,找到并点击【ComfyUI模型显示入口】,进入主操作页面:

提示:若未看到预期界面,请检查后台日志是否成功加载基础模型(如SDXL或SD1.5系列)。


3.2 Step 2:熟悉工作流主界面

进入系统后,你会看到一个空白或预加载的工作流画布,整体界面结构清晰,主要包括以下几个区域:

  • 左侧栏:节点库(Nodes),包含所有可用的功能模块
  • 中央区域:工作流画布(Canvas),用于放置和连接节点
  • 右侧面板:属性配置区,用于设置当前选中节点的参数
  • 顶部菜单栏:包含保存、加载、运行等核心操作按钮

如下图所示,这是典型的初始工作流界面:

注意:如果你使用的是预置镜像环境(如CSDN星图镜像广场提供的版本),可能已自动加载常用节点和模型路径,省去手动配置烦恼。


3.3 Step 3:选择需要使用的工作流

ComfyUI支持多种预设工作流模板,例如文生图(txt2img)、图生图(img2img)、ControlNet控制生成等。

在本例中,我们选择最基础的文生图工作流(Text-to-Image)。你可以通过以下方式之一加载该工作流:

  • 点击菜单栏的【Load】按钮,上传.json格式的工作流文件
  • 或直接使用系统自带的默认工作流(通常已预装)

如下图所示,选择对应的工作流模板并加载至画布:

建议:初次使用时推荐采用官方示例工作流,避免因节点缺失导致报错。


3.4 Step 4:输入图片描述文案(Prompt)

接下来是决定生成内容的关键步骤——填写正向提示词(Positive Prompt)反向提示词(Negative Prompt)

在工作流中找到对应的文本编码节点(通常标记为CLIP Text EncodePositive Prompt),双击打开编辑框,输入你想要生成的画面描述。

例如:

A beautiful sunset over the ocean, vibrant colors, cinematic lighting, high detail

反向提示词可填写:

blurry, low quality, distorted face, extra limbs

如下图所示,在指定模块中完成提示词输入:

技巧:使用英文描述效果更佳;关键词之间用逗号分隔;优先描述主体、风格、光照、分辨率等要素。


3.5 Step 5:点击【运行】开始生成

确认所有节点连接正确且提示词已填入后,即可准备执行生成任务。

请查看工作流是否已正确连接以下核心链路:

  • 模型加载 → CLIP编码 → UNET采样 → VAE解码 → 图像输出

一切就绪后,点击页面右上角的绿色【运行】按钮(Run):

此时,后端将开始执行推理任务。根据硬件性能不同,生成时间一般在5~30秒之间。

观察提示:运行过程中,终端或日志窗口会实时输出进度信息,如采样步数、显存占用等。


3.6 Step 6:查看生成结果

当任务完成后,生成的图像会自动出现在工作流中的图像输出节点(通常为Save ImagePreview Image节点)。

如下图所示,你可以在该模块中直接预览生成结果:

点击图片可放大查看细节,系统也会将其自动保存至本地output文件夹中(具体路径可在节点参数中配置)。

恭喜!你已经成功使用ComfyUI生成了第一张AI图像!


4. 总结

本文以“零基础入门”为目标,系统地介绍了如何在ComfyUI中完成首次图像生成任务。通过六个清晰步骤,我们完成了从环境进入、工作流选择、提示词输入到最终图像输出的全流程实践。

回顾核心要点:

  1. ComfyUI的优势在于可视化节点式架构,让复杂生成逻辑变得直观可控。
  2. 工作流模板是高效使用的前提,建议收藏常用模板以提升效率。
  3. 提示词质量直接影响输出效果,掌握关键词组织方法至关重要。
  4. 运行前务必检查节点连接完整性,避免因断连导致任务失败。
  5. 结合插件可拓展更多功能,如加入ControlNet实现姿势控制,后续可逐步深入。

对于初学者而言,熟练掌握这一基础流程是迈向高级应用的第一步。未来你可以尝试:

  • 导入自定义模型(如LoRA、Checkpoints)
  • 添加ControlNet进行构图控制
  • 构建多阶段生成流水线
  • 使用ADetailer优化人物面部细节

持续探索,你会发现ComfyUI远不止是一个图像生成器,而是一个强大的AI创意操作系统


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 13:50:24

OpenDataLab MinerU教程:PDF转可编辑文本详解

OpenDataLab MinerU教程:PDF转可编辑文本详解 1. 引言 在数字化办公和学术研究日益普及的今天,如何高效地从PDF文件中提取结构化、可编辑的文本内容成为一项关键需求。传统的OCR工具虽然能够识别文字,但在处理复杂版式、多栏排版、图表混排…

作者头像 李华
网站建设 2026/4/21 19:38:46

ACE-Step模型压缩:轻量化版本在边缘设备上的部署尝试

ACE-Step模型压缩:轻量化版本在边缘设备上的部署尝试 1. 背景与技术挑战 随着生成式AI在音频领域的快速发展,音乐生成模型逐渐从实验室走向实际应用场景。ACE-Step是由阶跃星辰(StepFun)与ACE Studio联合推出的开源音乐生成模型…

作者头像 李华
网站建设 2026/4/22 22:23:35

VibeThinker-1.5B-WEBUI实操手册:数学推理任务快速部署

VibeThinker-1.5B-WEBUI实操手册:数学推理任务快速部署 1. 简介与技术背景 VibeThinker-1.5B 是由微博开源的一款轻量级密集型语言模型,参数规模为15亿(1.5B),专为数学推理与算法编程任务设计。尽管其参数量相对较小…

作者头像 李华
网站建设 2026/4/21 15:37:53

GPEN跨平台部署尝试:Windows/Linux/Mac环境适配情况

GPEN跨平台部署尝试:Windows/Linux/Mac环境适配情况 1. 引言 1.1 背景与需求 随着AI图像修复技术的快速发展,GPEN(Generative Prior ENhancement)作为一款专注于人脸肖像增强的深度学习模型,因其出色的细节恢复能力…

作者头像 李华
网站建设 2026/4/17 4:41:02

Paraformer-large语音关键词提取:转写后信息提炼实战

Paraformer-large语音关键词提取:转写后信息提炼实战 1. 背景与应用场景 在语音处理的实际项目中,仅完成语音到文字的转写往往只是第一步。面对会议录音、访谈记录、客服对话等长音频内容,如何从大量转录文本中快速提取关键信息&#xff0c…

作者头像 李华
网站建设 2026/4/23 14:34:51

YOLOv8图像分割省钱攻略:按需付费比买显卡省90%

YOLOv8图像分割省钱攻略:按需付费比买显卡省90% 你是不是也遇到过这样的情况:手头有个紧急的医学图像分析项目,比如要做细胞图像的精准分割,但实验室的GPU服务器排期已经排到了一个月后?自己买一台高性能显卡又动辄三…

作者头像 李华