Skip to content

ComfyUI 基础指南

https://docs.comfy.org/zh-CN/get_started/introduction

大模型

确保 ComfyUI/models/checkpoints 文件夹至少有一个 SD1.5 模型文件。

  • 大模型存放路径:ComfyUI/models/checkpoints (必须)
  • LoRA 模型路径:ComfyUI/models/loras
版本参数量默认分辨率风格适用 GPU适合人群
SD 1.59.83 亿512x512多样(插画、动漫、写实)4GB+推荐普通用户,社区资源丰富
SD 2.110 亿768x768偏写实6GB+追求更高分辨率的用户
SDXL35 亿1024x1024超高质量、细节丰富8GB+双模型架构基础模型(Base)和精炼模型(Refiner)
SD 3.5 Large80 亿1024x1024超高质量、细节丰富10GB+专业用例,要求高性能的用户
SD 3.5 Large Turbo80 亿1024x1024超高质量、细节丰富8GB+需要快速生成高质量图像的用户
SD 3.5 Medium25 亿768x768高质量、细节丰富6GB+在消费级硬件上运行的用户

文生图节点

文生图(Text to Image) ,是AI绘图中的基础流程,通过输入文本描述来生成对应的图片,它的核心是扩散模型

1. Checkpoint 加载器

Checkpoint 加载器ComfyUI 用于加载Stable Diffusion模型核心节点。它负责加载模型权重,并传递给 KSampler 及其他相关节点。

2. CLIP Text Encoder

CLIP Text Encoder: 条件>CLIP文本编码器 主要用于正反提示词

3. KSampler 连接的主要节点及作用

KSampler: 采样>KSampler 采样节点

  • KSampler 连接节点
连接节点作用
Checkpoint Loader加载 Stable Diffusion 模型
CLIP Text Encode (Positive)处理正提示词,影响图像风格
CLIP Text Encode (Negative)处理反提示词,抑制不希望的元素
Latent 图像输入放大潜变量,提高图像分辨率
Latent 输出采样后的潜变量,后续需要解码成图像
Empty Latent Image生成初始潜变量,决定图像尺寸
  • KSampler 主要参数调节
参数作用
种子(Seed)控制随机性,相同的种子会生成相同的结果
生成后控制(Post-generation Control)设置 randomize 让种子随机变化
步数(Steps)采样步数,越高越精细,但生成时间增加
cfg(引导系数)影响图像对提示词的遵循程度,通常 5~12
采样器名称(Sampler Name)选择采样算法(Euler, DPM++ 等)
调度器(Scheduler)影响去噪方式(Normal, Karras, Exponential 等)
降噪(Denoise)影响最终图像的细节程度(通常 1.0 代表完整去噪)

VAE 解码(VAE Decode)节点介绍

VAE(Variational Autoencoder)作用是把“模糊的潜变量数据”翻译成清晰可见的图片Stable Diffusion 生成的图像最初是一团复杂的“代码”(潜变量)VAE 任务是 把“压缩数据”解码成完整、清晰、可见的图片!

  • VAE 解码的过程: (1) KSampler 生成的“潜变量” 🌀 → (2) 进入 VAE 解码器 🎛️ → (3) 变成可见的清晰图片 🖼️

  • VAE 解码节点有 两个输入端口一个输出端口

端口名称类型作用典型连接对象
Latent输入(紫色)需要解码的潜变量连接 KSampler
vae输入(橙色)VAE 模型文件连接 Checkpoint Loader
图像(Image)输出(蓝色)解码后的可见图像连接 保存图像显示图像

ComfyUI 插件

插件安装路径 ComfyUI_windows_portable\ComfyUI\custom_nodes 下载解压到该路径即可

翻译插件: comfyui_fk_server

提示词插件: ComfyUI_Custom_Nodes_AlekPet

comfyui-workspace-manager插件

ComfyUI-Manager插件

comfyui-mixlab-nodes 文字图片插件