ComfyUI-BrushNet张量尺寸冲突排查指南与避坑技巧-开发者社区

ComfyUI-BrushNet张量尺寸冲突排查指南与避坑技巧

【免费下载链接】ComfyUI-BrushNetComfyUI BrushNet nodes项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-BrushNet

问题定位：追踪神秘的尺寸不匹配错误

"Expected size 64 but got size 96" — 当这个错误提示突然出现在你的ComfyUI工作流中时，就像侦探遇到了第一个线索。作为技术侦探，我们首先需要确定：这个错误究竟发生在哪个环节？

通常有三个典型场景会触发这个问题：

首次运行BrushNet节点时，特别是切换不同模型（如从SD1.5切换到SDXL）
调整图像分辨率后，潜在空间尺寸未能同步更新
组合多个控制节点（如同时使用ControlNet和BrushNet）时的数据流冲突

💡技术侦探提示：错误日志中"at position 2"或"dimension 1"这样的描述，能帮我们快速定位是哪个轴上的尺寸出现了问题。

原因溯源：潜在空间的"尺寸密码"

要解开这个谜题，我们需要深入了解潜在空间（Latent Space）这个核心概念。在Stable Diffusion中，图像并不是直接处理的，而是先通过VAE编码器转换为低维潜在表示。

关键发现：通道数不匹配

通过对brushnet.py第830行的代码分析：

829: # 准备BrushNet条件输入 830: brushnet_cond=torch.concat([sample,brushnet_cond],1) 831: return brushnet_cond

我们发现这里的张量拼接操作要求sample和brushnet_cond必须具有相同的通道数和空间尺寸。当使用不同配置的模型时，这个条件很容易被打破。

隐藏线索：分辨率与潜在空间的换算关系

在brushnet_nodes.py中，我们找到了另一个关键证据：

if x.shape[2] != conditioning_latents.shape[2] or x.shape[3] != conditioning_latents.shape[3]: print('BrushNet inference: image', conditioning_latents.shape, 'and latent', x.shape, 'have different size, resizing image')

这揭示了一个重要规律：潜在空间的尺寸通常是原始图像尺寸的1/8。例如，512x512的图像会被编码为64x64的潜在空间。当这个比例被破坏时，尺寸冲突就不可避免了。

多维解决方案：破解尺寸谜题

🛠️ 方案一：使用原生潜在空间输出

最新版的BrushNet节点已内置潜在空间输出端口。通过直接连接这个输出到Ksampler，可从源头避免尺寸转换问题。

👉实操建议：在ComfyUI工作流中，将BrushNet节点的"latent"输出直接连接到Ksampler的"latent"输入，跳过额外的VAE编码步骤。

📏 方案二：强制执行尺寸对齐

当自动调整失败时，我们可以手动干预尺寸匹配：

# 添加到brushnet_nodes.py的预处理步骤 def ensure_size_match(latent, conditioning): if latent.shape[2:] != conditioning.shape[2:]: # 使用双线性插值调整条件尺寸 conditioning = torch.nn.functional.interpolate( conditioning, size=latent.shape[2:], mode='bilinear', align_corners=False ) return conditioning

👉实操建议：在BrushNet节点前添加一个"Latent Resize"节点，显式设置与主潜在空间相同的尺寸参数。

🔄 方案三：工作流参数标准化

建立一套标准化的参数配置能有效预防尺寸问题：

基础分辨率：统一使用512x512或1024x1024作为基准
批次大小：保持在1-2之间，避免内存波动导致的尺寸计算错误
控制权重：conditioning_scale建议设置在0.8-1.2范围

图1：标准化的BrushNet工作流配置，展示了正确的节点连接方式和参数设置

实战验证：从失败到成功的调试之旅

让我们通过一个真实案例展示完整的调试过程：

案发现场

用户报告：在使用example/object_removal.png进行图像修复时，出现"size mismatch"错误。

侦查过程

收集证据：检查工作流截图和错误日志
现场重建：复现错误环境，使用相同的模型和参数

尺寸测量：

# 使用Python查看潜在空间尺寸 python -c "import torch; print(torch.load('latent.pt').shape)"

发现线索：原始图像尺寸为1024x768，转换为潜在空间后为128x96，而模型期望128x128

解决方案实施

添加"Image Resize"节点，将输入图像调整为1024x1024
验证潜在空间尺寸变为128x128
重新运行工作流，错误消失

图2：图像修复工作流示例，展示了正确的尺寸匹配配置

经验总结：建立尺寸问题解决框架

核心原则：在ComfyUI中，所有连接的节点必须保持潜在空间尺寸的一致性，这包括高度、宽度和通道数三个维度。

预防措施

建立尺寸检查清单：
- 输入图像分辨率是否为8的倍数？
- 所有控制节点是否使用相同的潜在空间尺寸？
- 模型配置（如SD1.5 vs SDXL）是否与分辨率匹配？

版本控制：

# 确保使用最新版本的BrushNet cd /data/web/disk1/git_repo/gh_mirrors/co/ComfyUI-BrushNet git pull origin main pip install -r requirements.txt

冲突检测：定期检查已安装的ComfyUI节点是否存在兼容性问题

图3：展示了包含多个控制参数的复杂工作流配置

常见问题速查表

错误症状	可能原因	快速解决方案
Expected size 64 but got size 96	图像分辨率非8的倍数	调整图像尺寸为512x512或1024x1024
"conditioning"维度不匹配	控制网络与主网络尺寸冲突	使用潜在空间Resize节点统一尺寸
黑色输出或扭曲图像	VAE编码/解码尺寸不一致	验证VAE模型与分辨率匹配
推理速度异常缓慢	批次尺寸过大	将batch_size降低至1
提示词无效果	条件缩放因子设置不当	调整conditioning_scale至0.8-1.2