ComfyUI视频生成模型实战：当前最优选型与性能调优指南-开发者社区

ComfyUI视频生成模型实战：当前最优选型与性能调优指南

“昨天跑通的 SVD 工作流，今天更新节点就崩了。”
“AnimateDiff-Lightning 在 3090 上 24G 显存居然还能 OOM？”
“同样 512×512，别人 8s 出 64 帧，我 30s 才 16 帧？”

如果你也在 ComfyUI 里踩过这些坑，下面的踩坑笔记应该能帮你省几天头发。

1. 版本迭代快、性能差异大、参数多：为什么选个模型像抽盲盒？

ComfyUI 的节点一周三更，模型仓库更是“日更”。
同一模型，官方版、社区 pruned 版、fp16 版、onnx 版，后缀不同，速度差 3 倍。
关键参数（CFG Scale、Motion Bucket、Noise Augmentation）没有统一说明，复制别人工作流也常翻车。

于是我把 Stable Video Diffusion 1.0 / XL、AnimateDiff-Lightning、Zeroscope v2 一共 4 个主流模型拉到同一张卡上，用同一套输入（16 帧 512×512 提示图 + 文本描述），跑了一次“裸机 Benchmark”。结果先看表，后面再给可复现的 JSON。

2. 横向评测：3090 vs A100，谁才是性价比之王？

测试环境

ComfyUI 0.9.3 + xformers 0.0.22
CUDA 11.8，PyTorch 2.1，batch_size=1，帧数=16，steps=20

模型	显卡	输出分辨率	显存峰值	推理时间	FPS	备注
SVD 1.0	RTX 3090 24G	512×896	19.7 GB	12.8 s	1.25	默认 VAE-fp32
SVD 1.0	A100 40G	512×896	20.1 GB	7.4 s	2.16	无 offload
SVD-XL	RTX 3090	1024 refurb	OOM	—	—	需切分帧
SVD-XL	A100	再说	35.3 GB	28 s	0.57	质量↑，速度↓
AnimateDiff-Lightning	3090	512×512	11.2 GB	4.1 s	3.90	4-step 模式
AnimateDiff-Lightning	A100	512×512	11.4 GB	2.3 s	6.96	最快
Zeroscope v2	3090	512 revamped	15.6 GB	9.6 s	1.67	需二次解码

结论一句话：
“24G 显存封顶”场景下，AnimateDiff-Lightning 几乎是唯一“又快还能再塞点别的模型”的选项；A100 上 SVD-XL 能跑，但性价比被 Lightning 吊打。

3. 核心实现：一份带注释的 ComfyUI 工作流 JSON

下面这份 JSON 在 3090 上 5 分钟就能复现。重点节点已写注释，直接 Import 即可。

{ "1": { "inputs": { "ckpt_name": "animateDiff_lightning_4step.safetensors", "vae_name": "vae-ft-mse-840000-ema-pruned.ckpt", "clip_skip": -2 }, "class_type": "CheckpointLoaderSimple" }, "2": { "inputs": { "frame_count": 16, "fps": 8, "loop_count": 0, "filename_prefix": "lightning_demo", "format": "video/h264-mp4", "pix_fmt": "yuv420p", "crf": 18 }, "class_type": "VHS_VideoCombine" }, "3": { "inputs": { "images": ["4", 0], "frame_interpolation": "none", "interpolate_factor": 1 }, "class_type": "VHS_InterpolateFrames" }, "4": { "inputs": { "samples": ["5", 0], "vae": ["1", 2], "tile_size": 512 }, "class_type": "VAEDecodeTiled" }, "5": { "inputs": { "add_noise": true, "noise_strength": 0.75, "steps": 4, "cfg": 1.2, "seed": 12345, "motion_bucket_id": 127 }, "class_type": "AnimateDiffSampler" } }

关键调优技巧

VAE 解码务必用 Tiled，tile_size 取 32 的倍数，显存立降 30%。
Motion Bucket ID 127 是 Lightning 作者给的“中庸值”，<80 画面几乎不动，>180 会鬼畜。
CFG Scale 别照搬 SD 1.5 的 7-10，视频域 1.0-1.5 反而更稳定。
帧插值节点先关，后期再用 RIFE 外挂，一次性 16→64 帧，速度/质量比最高。

4. 避坑指南：生产环境 3 大常见病

显存溢出（OOM）
- 把“batch_run”节点拆成“单帧循环 + 帧缓存”，配合--lowvram启动参数；
- 开启 ComfyUI 设置里的 “Model CPU offload”，速度掉 10%，但能救急。
时序不一致（画面跳变）
- 检查是否误开“dpm++ sde” 这类随机采样器，视频请用 “euler” 或 “ddim”；
- 确保 latent 噪声初始种子固定，AnimateDiff 的 motion_module 每次加载相同权重。
颜色崩坏（发灰、过曝）
- VAE 用 ft-mse-840000 版，别用 SD1.5 自带 VAE；
- 后处理加一层 “ColorMatch” 节点，参考帧选第 0 帧，DeltaE 阈值 2.5。