news 2026/3/25 12:59:58

Meta-Llama-3.1-8B-bnb-4bit 下载加载

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Meta-Llama-3.1-8B-bnb-4bit 下载加载

Meta-Llama-3.1-8B-bnb-4bit 加载:

from huggingface_hub import InferenceClient from torch import nn from transformers import ( AutoModel, AutoProcessor, AutoTokenizer, AutoModelForCausalLM, PreTrainedTokenizer, PreTrainedTokenizerFast, BitsAndBytesConfig, ) from pathlib import Path import torch from PIL import Image import os # =============================== # CLIP (SigLIP) # # =============================== # model_id = "google/siglip-so400m-patch14-384" # CLIP_PATH = download_hg_model(model_id, "clip") # clip_processor = AutoProcessor.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = AutoModel.from_pretrained( # CLIP_PATH, # trust_remote_code=True # ) # clip_model = clip_model.vision_model # clip_model.eval() # clip_model.requires_grad_(False) # clip_model.to("cuda") # =============================== # LLM (LLaMA 3.1 4bit) # =============================== MODEL_PATH = "/data/lbg/models/textoon/ComfyUI/models/LLM/Meta-Llama-3.1-8B-bnb-4bit" tokenizer = AutoTokenizer.from_pretrained( MODEL_PATH, trust_remote_code=True, use_fast=True ) assert isinstance( tokenizer, (PreTrainedTokenizer, PreTrainedTokenizerFast) ), f"Tokenizer is of type {type(tokenizer)}" # ⭐ 2️⃣ bitsandbytes 4bit 配置(关键) bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.float16, bnb_4bit_use_double_quant=True, ) # ⭐ 3️⃣ 正确加载 4bit 模型 text_model = AutoModelForCausalLM.from_pretrained( MODEL_PATH, quantization_config=bnb_config, device_map="auto", trust_remote_code=True, ) text_model.eval()
pip install bitsandbytes
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/24 23:09:51

【学习心得】Python好库推荐——pyttsx3

pyttsx3(Python Text-to-Speech eXtended version 3)是一个跨平台的 Python 库,用于将文本转换为语音(Text-to-Speech, TTS)。它可以在不依赖互联网连接的情况下,在本地将文本朗读出来,支持 Win…

作者头像 李华
网站建设 2026/3/24 18:12:26

Linux 通用软件包 AppImage 打包详解

格式介绍 - AppImageAppImage 是 Linux 系统中一种新型的软件包格式,它与 rpm、deb 这些软件包格式相比最大的不同便是:(1)无需安装,即用即删。(2)只需打包一次,便可到处运行。完美的…

作者头像 李华
网站建设 2026/3/24 23:50:31

软件测试工具选型全景指南:从需求对齐到落地实践

为什么工具选型关乎测试成败 在快速迭代的软件开发周期中,测试工具已从辅助手段演进为质量保障的核心基础设施。据统计,超过67%的测试团队曾因工具选型不当导致项目延期或质量漏洞。2025年测试工具生态呈现两大趋势:AI驱动的智能测试平台快速…

作者头像 李华
网站建设 2026/3/22 17:38:51

自动化测试投资回报率(ROI)分析与实践指南

在软件开发周期不断缩短的当下,自动化测试已成为保障产品质量、提升测试效率的关键手段。然而,许多测试团队在推行自动化测试时面临共同困惑:如何量化自动化测试的投入产出比?本文将从测试从业者视角,深入解析自动化测…

作者头像 李华
网站建设 2026/3/21 6:57:58

企业微信群消息定时发送竟然这么简单?三步搞定让效率翻倍!

你是不是还在手动发送每天的晨会提醒?或者每到下班时间就急着往群里发日报?别折腾了,现在有个方法能让你彻底解放双手。想想看,每天固定要发的通知、报表、提醒,如果都能自动完成,那该多省心啊。连趣云控制…

作者头像 李华