QwenTTS 预设音色-开发者社区

import torch import soundfile as sf from qwen_tts import Qwen3TTSModel import os # ============ 1. 设置代理 (如果需要) ============ os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890' os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890' # ============ 2. 定义你要保存模型的【指定文件夹】路径 ============ # 使用绝对路径，例如在D盘创建一个`my_tts_models`文件夹 TARGET_MODEL_DIR = r"D:\AI\short_video\tts\Qwen3-TTS-0.6B-CustomVoice" # 下载目录和导入目录都是要一个啊 # 我是用的github下载的 目录结构不变 git clone https://huggingface.co/Qwen/Qwen3-TTS-12Hz-0.6B-CustomVoic.git # ============ 3. 加载模型 (关键修正) ============ model = Qwen3TTSModel.from_pretrained( r"D:\AI\short_video\tts\Qwen3-TTS-12Hz-0.6B-CustomVoice", # 1. 必须用0.6B 2. 必须用CustomVoice cache_dir=TARGET_MODEL_DIR, # 关键参数：指定下载目录 device_map="cuda", # dtype=torch.float16, # 报错就关掉 # attn_implementation="flash_attention_2", # 如果没装flash-attn，先注释掉 ) # 强制清理GPU缓存并验证 import torch torch.cuda.empty_cache() print(f"当前显存占用: {torch.cuda.memory_allocated(0)/1024**3:.2f} GB") # 检查输入数据 print("模型加载完成，准备生成...") # ============ 4. 生成语音 (使用预设音色的纯TTS) ============ wavs, sr = model.generate_custom_voice( text="沈逸琛遭养子沈寒轩陷害被送精神病院，还被顶替作家身份。沈家逼他替婚石宕村姑娘，殊不知对方是首富千金叶婉晨。二人联手，在作家论坛戳穿沈寒轩真面目，又在招标会曝光其罪行与私生子身份。最终恶人落网，沈逸琛复仇成功，与叶婉晨终成眷属。", language="Chinese", speaker="Uncle_Fu", # 使用预设音色 instruct="用解说文案的语气", # 纯TTS，指令留空。或者直接省略此参数。 ) # ============ 5. 将生成的音频保存到【指定输出文件夹】 ============ TARGET_AUDIO_DIR = r"D:\AI\short_video\tts" # 定义你的音频输出文件夹 os.makedirs(TARGET_AUDIO_DIR, exist_ok=True) # 确保文件夹存在 output_path = os.path.join(TARGET_AUDIO_DIR, "output_custom_voice.wav") sf.write(output_path, wavs[0], sr) print(f"✅ 语音生成成功！模型已下载/加载至：{TARGET_MODEL_DIR}") print(f"✅ 音频文件已保存至：{output_path}")

Speaker	Voice Description	Native language
Vivian	Bright, slightly edgy young female voice.	Chinese
Serena	Warm, gentle young female voice.	Chinese
Uncle_Fu	Seasoned male voice with a low, mellow timbre.	Chinese
Dylan	Youthful Beijing male voice with a clear, natural timbre.	Chinese (Beijing Dialect)
Eric	Lively Chengdu male voice with a slightly husky brightness.	Chinese (Sichuan Dialect)
Ryan	Dynamic male voice with strong rhythmic drive.	English
Aiden	Sunny American male voice with a clear midrange.	English
Ono_Anna	Playful Japanese female voice with a light, nimble timbre.	Japanese
Sohee	Warm Korean female voice with rich emotion.	Korean

RAG真正难点揭秘：不是检索，而是知识库管理！

文章通过物流系统比喻，指出RAG的真正难点不在检索端，而在于知识库管理。如同物流中心的核心在于仓库管理而非货物运输，RAG系统也依赖于完善的知识库管理体系来处理数据的新增、更新、分类等问题，特别是在大规模数据场景下&#xf…

李华

智能环境监测系统设计

目录智能环境监测系统概述核心组成部分关键技术应用场景示例代码示例（数据上传）扩展功能源码文档获取/同行可拿货,招校园代理 ：文章底部获取博主联系方式！ 智能环境监测系统概述智能环境监测系统是一种基于物联网（…

李华

智能避障扫地机器人

目录智能避障扫地机器人的工作原理主流避障技术分类典型产品性能参数选购注意事项维护保养要点源码文档获取/同行可拿货,招校园代理 ：文章底部获取博主联系方式！ 智能避障扫地机器人的工作原理智能避障扫地机器人通过多传感器融合技术实现环境感知与…

李华

将“100小时精通Oracle ERP，华为MetaERP和SAP”称为“不得不把握的世纪机会”

在当今数字化转型的浪潮中，能同时掌握这三大巨头（两大国际巨头一个中国自研翘楚）的知识，无疑会为您的职业生涯带来巨大的竞争优势。然而，我们必须现实地看待“100小时”和“精通”这两个词。 “精通” 在ERP领域通常…

李华

华为MetaERP的成本优势不仅在于直接省掉软件许可费，更体现在通过全栈自研的技术架构和智能化能力，从长期运营中实现“极低成本”。

华为MetaERP的成本优势不仅在于直接省掉软件许可费，更体现在通过全栈自研的技术架构和智能化能力，从长期运营中实现“极低成本”。其优势具体如下表所示：成本优势类别具体表现关键数据/案例支撑直接成本削减软件许可费归零：替代Or…

李华

一篇文章讲清楚：中转API如何用Python调用ChatGPT

你是否遇到过这样的场景？ 想把 ChatGPT 接入自己的应用，却被模型限制、价格波动、接口差异搞得一头雾水； 刚写好的代码，换一个模型就要重构一遍； 好不容易跑通了，又发现前端、后端、流式输出全都要重新适配…

李华