Appearance
ComfyUI 基础指南
大模型
确保 ComfyUI/models/checkpoints
文件夹至少有一个 SD1.5
模型文件。
- 大模型存放路径:
ComfyUI/models/checkpoints
(必须) - LoRA 模型路径:
ComfyUI/models/loras
版本 | 参数量 | 默认分辨率 | 风格 | 适用 GPU | 适合人群 |
---|---|---|---|---|---|
SD 1.5 | 9.83 亿 | 512x512 | 多样(插画、动漫、写实) | 4GB+ | 推荐普通用户,社区资源丰富 |
SD 2.1 | 10 亿 | 768x768 | 偏写实 | 6GB+ | 追求更高分辨率的用户 |
SDXL | 35 亿 | 1024x1024 | 超高质量、细节丰富 | 8GB+ | 双模型架构基础模型(Base)和精炼模型(Refiner) |
SD 3.5 Large | 80 亿 | 1024x1024 | 超高质量、细节丰富 | 10GB+ | 专业用例,要求高性能的用户 |
SD 3.5 Large Turbo | 80 亿 | 1024x1024 | 超高质量、细节丰富 | 8GB+ | 需要快速生成高质量图像的用户 |
SD 3.5 Medium | 25 亿 | 768x768 | 高质量、细节丰富 | 6GB+ | 在消费级硬件上运行的用户 |
文生图节点
文生图(Text to Image) ,是AI绘图中的基础流程,通过输入文本描述来生成对应的图片,它的核心是扩散模型。
1. Checkpoint 加载器
Checkpoint 加载器 是 ComfyUI 用于加载Stable Diffusion模型核心节点。它负责加载模型权重,并传递给 KSampler 及其他相关节点。
2. CLIP Text Encoder
CLIP Text Encoder: 条件>CLIP文本编码器
主要用于正反提示词
3. KSampler 连接的主要节点及作用
KSampler: 采样>KSampler
采样节点
- KSampler 连接节点
连接节点 | 作用 |
---|---|
Checkpoint Loader | 加载 Stable Diffusion 模型 |
CLIP Text Encode (Positive) | 处理正提示词,影响图像风格 |
CLIP Text Encode (Negative) | 处理反提示词,抑制不希望的元素 |
Latent 图像输入 | 放大潜变量,提高图像分辨率 |
Latent 输出 | 采样后的潜变量,后续需要解码成图像 |
Empty Latent Image | 生成初始潜变量,决定图像尺寸 |
- KSampler 主要参数调节
参数 | 作用 |
---|---|
种子(Seed) | 控制随机性,相同的种子会生成相同的结果 |
生成后控制(Post-generation Control) | 设置 randomize 让种子随机变化 |
步数(Steps) | 采样步数,越高越精细,但生成时间增加 |
cfg(引导系数) | 影响图像对提示词的遵循程度,通常 5~12 |
采样器名称(Sampler Name) | 选择采样算法(Euler, DPM++ 等) |
调度器(Scheduler) | 影响去噪方式(Normal, Karras, Exponential 等) |
降噪(Denoise) | 影响最终图像的细节程度(通常 1.0 代表完整去噪) |
VAE 解码(VAE Decode)节点介绍
VAE(Variational Autoencoder)作用是把“模糊的潜变量数据”翻译成清晰可见的图片。Stable Diffusion
生成的图像最初是一团复杂的“代码”(潜变量),VAE
任务是 把“压缩数据”解码成完整、清晰、可见的图片!
VAE 解码的过程: (1) KSampler 生成的“潜变量” 🌀 → (2) 进入 VAE 解码器 🎛️ → (3) 变成可见的清晰图片 🖼️
VAE 解码节点有 两个输入端口 和 一个输出端口:
端口名称 | 类型 | 作用 | 典型连接对象 |
---|---|---|---|
Latent | 输入(紫色) | 需要解码的潜变量 | 连接 KSampler |
vae | 输入(橙色) | VAE 模型文件 | 连接 Checkpoint Loader |
图像(Image) | 输出(蓝色) | 解码后的可见图像 | 连接 保存图像 或 显示图像 |
ComfyUI 插件
插件安装路径 ComfyUI_windows_portable\ComfyUI\custom_nodes
下载解压到该路径即可