news 2026/5/13 12:18:23

GLM-TTS - 自然、富有情感和表现力的语音克隆/文本转语音系统 支持批量生成 支持50系显卡 一键整合包下载

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
GLM-TTS - 自然、富有情感和表现力的语音克隆/文本转语音系统 支持批量生成 支持50系显卡 一键整合包下载

GLM-TTS 是智谱AI开源的一个新型的文本转语音(TTS)系统,它能在“零样本”条件下模仿声音,在极少的语音样本模仿声音,生成自然、有情绪的语音,并且让合成语音更有情感和表现力。它的特点是可控、自然、支持实时推理。


GLM-TTS 就像是“情感版的语音生成器”,不仅能把文字变成声音,还能让声音带上情绪和个性。它的应用场景非常广泛,尤其适合需要自然、富有表现力语音的领域。

GLM-TTS 测试下来,相比同类文本转语音系统,除了克隆音色相似度更高外,在情感表达和自然度方便也更好,还有就是长文本生成更稳定,且速度快,生成的音频质量也更高。缺点是对显卡要求高,至少需要8G显存,长文本对显卡要求更高。


今天分享的 GLM-TTS 一键包,基于原版WebUI,新增了音色管理功能,支持自定义保存和加载音色;新增批量生成功能,支持一键上传多个txt文档批量生成语音。批量生成需要更多的显存资源,大家根据自己显卡选择批量生成的数量。

下载地址:点此下载



主要特点

零样本语音克隆:只需 3–10 秒的语音片段,就能快速模仿目标声音。
情感控制:通过多奖励强化学习(GRPO),让语音带有情绪和表现力,而不是平淡机械。
高质量合成:生成的语音在清晰度和自然度上接近商业系统,并且字符错误率(CER)更低。
精细控制:支持“音素 + 文本”混合输入,能精确控制发音,尤其适合多音字。
实时推理:支持流式生成,适合需要即时反馈的场景。
双语支持:针对中英文混合文本进行了优化。



应用领域

虚拟助手与客服机器人:让语音更自然、更有情感,提升用户体验。
有声读物与播客:快速生成不同风格和情绪的朗读,减少人工录音成本。
游戏与虚拟角色:为 NPC 或虚拟角色生成个性化、有情感的声音。
教育与培训:在语言学习或在线课程中提供更生动的语音讲解。
无障碍应用:帮助视障人士获得更自然的语音反馈。



使用教程:(建议N卡,显存8G起,支持50系显卡)


分别下载主程序压缩包和模型(ckpt文件夹),解压主程序,移动ckpt目录到主程序下即可。

上传需要克隆的参考音频,输入参考文本,输入需要生成文字内容,设置相关参数,生成即可。

音色管理:上传需要保存的音色音频和参考文本,输入音色名称,保存。右侧加载音色,选择音色,输入需要生成的文字内容,生成即可。
批量生成:批量上传多个txt文本文档,刷新音色,选择音色,批量生成。生成结果保存在 batch_outputs 目录,可一键下载打包文件。

实测8G显存开启共享显存也能运行,但速度略慢,建议10G起,长文本建议12G显存起。


软件目录结构:

📂 ckpt/
├── 📂 flow/
│ │ └── flow.pt
│ ├── 📂 llm/
│ │ └── model-00001-of-00002.safetensors
│ └── 📂 vq32k-phoneme-tokenizer/
│ └── tokenizer.model
📂 deepface/
📂 tools/
......

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/7 6:13:13

Termius中文汉化版:极速上手的移动端SSH神器

Termius中文汉化版:极速上手的移动端SSH神器 【免费下载链接】Termius-zh_CN 汉化版的Termius安卓客户端 项目地址: https://gitcode.com/alongw/Termius-zh_CN 还在为英文SSH客户端而头疼吗?每次连接服务器都要面对满屏的英文界面和难以理解的错…

作者头像 李华
网站建设 2026/5/13 12:17:52

Vue PDF嵌入组件:构建现代化文档预览体验的完整指南

Vue PDF嵌入组件:构建现代化文档预览体验的完整指南 【免费下载链接】vue-pdf-embed PDF embed component for Vue 2 and Vue 3 项目地址: https://gitcode.com/gh_mirrors/vu/vue-pdf-embed 在当今数字化办公时代,PDF文档已成为企业信息传递和知…

作者头像 李华
网站建设 2026/5/13 12:18:09

MouseTester终极指南:从性能瓶颈诊断到精准优化实战

MouseTester终极指南:从性能瓶颈诊断到精准优化实战 【免费下载链接】MouseTester 项目地址: https://gitcode.com/gh_mirrors/mo/MouseTester 还在为鼠标响应延迟、光标漂移等问题困扰?专业鼠标性能测试工具MouseTester通过开源技术方案&#x…

作者头像 李华
网站建设 2026/5/3 17:10:48

暗黑3自动化工具深度解析:技能连招系统与实战配置指南

暗黑3自动化工具深度解析:技能连招系统与实战配置指南 【免费下载链接】D3keyHelper D3KeyHelper是一个有图形界面,可自定义配置的暗黑3鼠标宏工具。 项目地址: https://gitcode.com/gh_mirrors/d3/D3keyHelper D3keyHelper作为一款专业的暗黑3自…

作者头像 李华
网站建设 2026/5/10 15:06:34

顾炎武《日知录》

顾炎武《日知录》1. 顾炎武《日知录》2. 梁启超《痛定罪言》References顾炎武是明末清初思想家、学者。与黄宗羲、王夫之并称“明末三大儒”、“明末三先生”或“明末三大思想家”。 1. 顾炎武《日知录》 古文岛 https://www.guwendao.net/guwen/book_9bd135b79a36.aspx 中国…

作者头像 李华
网站建设 2026/5/2 10:50:29

WinAsar:Windows平台asar文件处理利器,让Electron应用打包更简单

WinAsar:Windows平台asar文件处理利器,让Electron应用打包更简单 【免费下载链接】WinAsar 项目地址: https://gitcode.com/gh_mirrors/wi/WinAsar WinAsar是一款专为Windows用户设计的asar文件处理工具,提供直观的图形界面让用户轻松…

作者头像 李华