news 2026/6/1 17:49:54

taming-transformers代码使用过程中的报错“packaging.version.InvalidVersion: Invalid version: ‘0.10.1,<0.11‘pyt”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
taming-transformers代码使用过程中的报错“packaging.version.InvalidVersion: Invalid version: ‘0.10.1,<0.11‘pyt”

论文下载:https://arxiv.org/abs/2012.09841

代码下载:https://github.com/CompVis/taming-transformers(VQ-GAN)

论文Neural Discrete Representation Learning(VQ-VAE)详解(PyTorch)

论文VQ-VAE-2(Generating Diverse High-Fidelity Images with VQ-VAE-2)详解(PyTorch)

论文VQ-GAN(Taming Transformers for High-Resolution Image Synthesis)高分辨图像生成讲解(PyTorch)

我们在使用taming-transformers代码时,根据作者提供的environment.yaml来安装相关的库,当然下面这种安装方式最终的torch和torchvision都是cpu版本的,如果要安装GPU版本的,只需要去讲对应1.7.0的cuda版本的torch下载下来之后,pip install XXX就可以安装了,这种安装方式比较不容易失败。

但是我们发现安装完成之后运行“sample_fast.py”依然会报错“packaging.version.InvalidVersion: Invalid version: '0.10.1,<0.11'pyt”这个问题,是版本出现了问题。虽然我看了网上的直接使用“conda env create -f environment.yaml”安装之后就可以正常运行,我不是很清楚是怎么回事,反正通过报错的情况好像是和transformers依赖的库有关,但是作者提供的transformers==4.3.1版本的,最后尝试了很多方式都不行,然后将transformers==4.2.0即可。

conda env create -f environment.yaml

name: taming channels: - pytorch - defaults dependencies: - python=3.8.5 - pip=20.3 - cudatoolkit=10.2 - pytorch=1.7.0 - torchvision=0.8.1 - numpy=1.19.2 - pip: - albumentations==0.4.3 - opencv-python==4.1.2.30 - pudb==2019.2 - imageio==2.9.0 - imageio-ffmpeg==0.4.2 - pytorch-lightning==1.0.8 - omegaconf==2.0.0 - test-tube>=0.7.5 - streamlit>=0.73.1 - einops==0.3.0 - more-itertools>=8.0.0 - transformers==4.3.1 - -e .

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/31 3:29:04

使用Terraform定义GLM-TTS云上基础设施即代码部署模板

使用Terraform定义GLM-TTS云上基础设施即代码部署模板 在生成式AI浪潮席卷各行各业的今天&#xff0c;语音合成技术正从“能说”迈向“像人说”的新阶段。特别是零样本语音克隆能力的突破&#xff0c;让仅凭几秒音频就能还原说话人音色成为现实——这正是 GLM-TTS 这类前沿开源…

作者头像 李华
网站建设 2026/5/28 14:34:27

GLM-TTS能否支持婚礼主持?喜庆氛围语音风格迁移

GLM-TTS能否支持婚礼主持&#xff1f;喜庆氛围语音风格迁移 在一场婚礼上&#xff0c;主持人的一句“百年好合”如果语气生硬、节奏平缓&#xff0c;可能瞬间削弱仪式感&#xff1b;而若语调上扬、情感饱满&#xff0c;则能点燃全场气氛。这种微妙的情绪传递&#xff0c;正是传…

作者头像 李华
网站建设 2026/5/30 19:27:50

基于GLM-TTS的情感语音标注数据集构建方法研究

基于GLM-TTS的情感语音标注数据集构建方法研究 在虚拟助手越来越“懂人心”、有声读物开始传递情绪起伏的今天&#xff0c;语音合成早已不再满足于“把字念出来”。用户期待的是会笑、会叹气、能愤怒也能温柔的声音。这种从“工具性发声”向“情感化表达”的跃迁&#xff0c;正…

作者头像 李华
网站建设 2026/5/30 23:59:51

语音合成中的上下文记忆能力:维持多轮对话一致性

语音合成中的上下文记忆能力&#xff1a;维持多轮对话一致性 在虚拟助手与用户连续对话时&#xff0c;突然从温柔女声变成低沉男音&#xff1b;或是有声书读到第三章&#xff0c;主角的口吻却和第一章判若两人——这类体验断裂的问题&#xff0c;在传统语音合成系统中屡见不鲜。…

作者头像 李华
网站建设 2026/5/30 15:13:03

Zephyr多级省电模式对比分析:快速理解差异

Zephyr 多级省电模式深度解析&#xff1a;从原理到实战的功耗优化指南在物联网设备日益普及的今天&#xff0c;一块电池能撑多久&#xff0c;往往直接决定了产品的成败。尤其是那些部署在偏远地区、无法频繁更换电池的传感器节点——比如森林里的温湿度监测器、贴在货架上的电子…

作者头像 李华
网站建设 2026/5/30 19:33:22

es连接工具接入Kibana的完整示例

手把手教你打通 Kibana 与 Elasticsearch 的“任督二脉”你有没有遇到过这种情况&#xff1a;Kibana 启动了&#xff0c;页面也打开了&#xff0c;但一进去就提示“Unable to connect to Elasticsearch”&#xff1f;或者图表加载半天没反应&#xff0c;日志里一堆request time…

作者头像 李华