news 2026/1/11 7:45:36

第六十一篇-ComfyUI+V100-32G+GGUF+运行Flux Schnell GGUF

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
第六十一篇-ComfyUI+V100-32G+GGUF+运行Flux Schnell GGUF

环境

系统:CentOS-7 CPU : E5-2680V4 14核28线程 内存:DDR4 2133 32G * 2 显卡:Tesla V100-32G【PG503】 (水冷) 驱动: 535 CUDA: 12.2 ComfyUI version: 0.4.0 ComfyUI frontend version: 1.34.8

系统软件信息

系统信息 OS linux Python Version 3.12.12 | packaged by Anaconda, Inc. | (main, Oct 21 2025, 20:16:04) [GCC 11.2.0] Embedded Python false Pytorch Version 2.9.1+cu128 Arguments main.py --listen --port 8188 --cuda-malloc --lowvram RAM Total 62.68 GB RAM Free 60.25 GB

启动

python main.py --listen --port8188--cuda-malloc --lowvram

参考

基于ComfyUI的Flux Schnell案例修改模型为GGUF加载器 [第五十九篇-ComfyUI+V100-32G+运行Flux Schnell-CSDN博客](https://blog.csdn.net/hai4321/article/details/155953374)

ComfyUI安装GGUF支持

进入你看着ComfyUI目录的custom_nodes cd ComfyUI/custom_nodes 克隆代码 git clone https://github.com/city96/ComfyUI-GGUF 安装依赖 pip install -r requirements.txt 重启ComfyUI

下载GGUF模型

https://hf-mirror.com/city96/FLUX.1-schnell-gguf/resolve/main/flux1-schnell-Q4_K_S.gguf?download=true
放入ComfyUI/models/unet文件夹中

调整模型加载器

删除Setp1 UNet加载器

添加【节点库】–》【UnetLoader(GGUF)】-》【选择flux1-schnell-Q4_K_S.gguf】

Flux Schnell完整版文生图

保存工作流

Ctrl+S

运行结果

第一次时间长一点

参数

1024*1024

时间

gguf qtypes: F32(468), Q4_K(304), F16(4)model weight dtype torch.float16, manual cast: None model_type FLOW Requested to load Flux loaded completely;30387.70MB usable,6595.58MB loaded, full load: True100%|███████████████████████████████████████████████████████████████████████████████████████|4/4[00:06<00:00,1.69s/it]Prompt executedin11.09seconds got prompt100%|███████████████████████████████████████████████████████████|4/4[00:06<00:00,1.70s/it]Prompt executedin7.59seconds got prompt100%|███████████████████████████████████████████████████████████|4/4[00:06<00:00,1.70s/it]Prompt executedin7.61seconds

GPU

Tue Dec1621:42:542025+---------------------------------------------------------------------------------------+|NVIDIA-SMI535.129.03 Driver Version:535.129.03 CUDA Version:12.2||-----------------------------------------+----------------------+----------------------+|GPU Name Persistence-M|Bus-Id Disp.A|Volatile Uncorr. ECC||Fan Temp Perf Pwr:Usage/Cap|Memory-Usage|GPU-Util Compute M.||||MIG M.||=========================================+======================+======================||0Tesla PG503-216 On|00000000:04:00.0 Off|0||N/A 21C P0 36W / 250W|7184MiB / 32768MiB|0% Default||||N/A|+-----------------------------------------+----------------------+----------------------+

总结

1.GPU 占用7-8G 2.GPU 100% 3.7 秒左右一张1024*1024 4.还是挺好用的,GPU内存占用只有7G多,比fp16少很多
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/16 22:15:04

Linux线程操作全指南

Linux线程概述与操作指南线程与进程对比线程是轻量级进程&#xff0c;属于某个进程&#xff0c;共享进程资源但拥有独立栈区&#xff08;默认8MB&#xff09;。进程资源独立&#xff0c;稳定性更高&#xff1b;线程崩溃可能导致整个进程崩溃。线程创建开销更小&#xff08;仅需…

作者头像 李华
网站建设 2026/1/5 12:13:54

传统VS智能:DBC文件处理效率对比实验

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 开发一个DBC文件处理效率对比工具。工具应能&#xff1a;1) 自动生成测试用DBC文件 2) 提供传统手动解析方法 3) 实现AI自动解析方法 4) 记录并对比两种方法的处理时间和准确性。输…

作者头像 李华
网站建设 2025/12/16 22:14:25

LobeChat能否支持生物识别?人脸/声纹/步态特征分析应用

LobeChat能否支持生物识别&#xff1f;人脸/声纹/步态特征分析应用 在智能设备日益渗透日常生活的今天&#xff0c;用户对AI助手的期待早已超越“能聊天”的基础功能。我们希望它认识我、理解我&#xff0c;甚至在我开口之前就知道我想做什么——这种“感知型交互”正成为下一代…

作者头像 李华
网站建设 2025/12/16 22:14:08

Miniconda实现Python多版本灵活切换

Miniconda 实现 Python 多版本灵活切换 在机器学习和科学计算的日常开发中&#xff0c;你是否也曾陷入这样的“环境地狱”&#xff1f;&#x1f631; “这个项目用 PyTorch 1.13&#xff0c;必须 Python 3.9&#xff0c;但我的系统是 3.11。”“同事跑通的代码&#xff0c;我一…

作者头像 李华
网站建设 2025/12/16 22:11:38

场馆预约小程序开发:解锁 “预约经济” 的高效解决方案

在数字化转型加速的背景下&#xff0c;场馆预约需求已渗透体育、办公、教育、文旅等多个领域。传统线下预约模式存在 “信息不透明、操作繁琐、管理低效” 等痛点&#xff0c;而小程序凭借 “轻量化、高触达、易操作” 的优势&#xff0c;成为场馆预约场景的理想载体。本文从核…

作者头像 李华
网站建设 2025/12/16 22:10:40

Product Hunt 每日热榜 | 2025-12-16

1. Unloop 标语&#xff1a;为注意力缺陷多动症&#xff08;ADHD&#xff09;和神经多样性思维者设计的视觉模式映射 介绍&#xff1a;Unloop 是一款可视化的模式映射工具&#xff0c;帮助你识别那些让你感到陷入困境的触发因素、想法、情绪和行为。把这些内容可视化&#xf…

作者头像 李华