news 2026/4/17 12:45:57

租用共绩算力4090实测龙猫图片编辑

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
租用共绩算力4090实测龙猫图片编辑

本人实测发现,本地配备的 16GB 显存显卡无法运行 LongCat-Image(龙猫图片编辑)项目,即便开启 CPU offloading(CPU 卸载)功能缓解显存压力,依然因显存不足导致运行失败。
为此,我在网上寻找共享算力资源,最终选择租用 4090 显卡进行测试,所使用的算力平台为【共绩算力】(官网:https://www.gongjiyun.com/)。

值得一提的是,该平台对个人开发者提供免费算力申请的机会,降低了测试和开发的成本。

该平台创建云主机的流程十分便捷,基础镜像已预装Miniconda等开发必备软件,无需额外配置基础环境,极大节省了前期准备时间。考虑到需妥善保存项目数据,我额外开通了共享存储卷并挂载至云主机。不过结合两次创建云主机的实测体验来看,共享存储卷存在明显短板——读写速度较慢;而云主机自带的本地存储则表现更优,读写效率显著更高,建议大家根据实际需求选择存储方式。

登录云主机后,可直接参照 LongCat-Image 的官方仓库(https://github.com/meituan-longcat/LongCat-Image)执行以下安装步骤:

# 克隆项目仓库(仅拉取main分支) git clone --single-branch --branch main https://github.com/meituan-longcat/LongCat-Image cd LongCat-Image # 创建并激活conda虚拟环境(指定Python 3.10版本) conda create -n longcat-image python=3.10 conda activate longcat-image # 安装项目依赖并以开发模式安装项目 pip install -r requirements.txt python setup.py develop # 配置Hugging Face镜像并下载模型权重 pip install "huggingface_hub[cli]" export HF_ENDPOINT=https://hf-mirror.com huggingface-cli download meituan-longcat/LongCat-Image-Edit --local-dir ./weights/LongCat-Image-Edit

环境配置完成后,运行示例脚本进行图片编辑测试:

python scripts/inference_edit.py

需要说明的是,项目代码中已内置CPU offloading机制,核心代码如下,其作用是将部分模型权重卸载至CPU,以此降低显存占用、避免出现OOM(显存溢出)错误:

pipe.enable_model_cpu_offload()# Offload to CPU to save VRAM (Required ~19 GB); slower but prevents OOMgenerator=torch.Generator("cpu").manual_seed(43)

即便开启了该优化机制,实测运行过程中显卡显存峰值占用仍达约17GB。这也印证了本地16GB显存显卡无法运行的核心原因——显存容量不足;而4090显卡的24GB显存,恰好能满足项目稳定运行的需求。

以下为本次测试的实际效果对比:
demo中编辑前的原图:

经过LongCat-Image编辑实现将“车换成摩托车”后的效果:

从编辑效果来看,整体表现十分出色:不仅成功实现了“车换摩托车”的核心需求,细节处理也相当到位,就连阴影部分都还原得自然逼真,没有出现明显的违和感。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/13 16:58:56

语音风格插值实验:混合两种情感生成中间态

语音风格插值实验:混合两种情感生成中间态 在虚拟助手轻声安慰用户、游戏角色因剧情推进而情绪波动的今天,我们对“机器发声”的期待早已超越了清晰朗读文本的基本要求。真正打动人心的,是那句带着一丝犹豫的鼓励,或是笑声中夹杂着…

作者头像 李华
网站建设 2026/4/17 7:10:02

EmotiVoice能否生成带有犹豫感的真实对话?

EmotiVoice能否生成带有犹豫感的真实对话? 在游戏NPC突然停顿、结巴着说出“这……我不确定”的那一刻,你是否曾感到一丝惊讶?那种迟疑的语气不像预录语音,倒像是它真的在思考。这背后,正是情感语音合成技术迈向“心理…

作者头像 李华
网站建设 2026/4/13 12:07:24

支持中文多情感表达的TTS开源模型——EmotiVoice评测

支持中文多情感表达的TTS开源模型——EmotiVoice评测 在虚拟主播深情演绎剧情、智能客服轻声安抚用户情绪、游戏NPC因愤怒而语气突变的今天,语音合成早已不再是“把文字念出来”那么简单。人们期待的不再只是清晰发音,而是能传递喜怒哀乐、带有温度与个性…

作者头像 李华
网站建设 2026/4/11 1:31:25

EmotiVoice情感库扩展方法:自定义情绪类型教程

EmotiVoice情感库扩展方法:自定义情绪类型教程 在虚拟主播的直播中突然冷笑,在游戏NPC对话时流露出轻蔑的讽刺语气——这些细腻的情感表达,正是当前语音合成技术追求的新高度。传统的文本转语音系统早已无法满足用户对“有温度的声音”的期待…

作者头像 李华
网站建设 2026/4/16 17:25:25

EmotiVoice镜像预装服务:一键部署免去环境配置烦恼

EmotiVoice镜像预装服务:一键部署免去环境配置烦恼 在智能语音应用快速普及的今天,越来越多的产品开始集成文本转语音(TTS)能力——从车载助手到教育机器人,从有声书平台到游戏NPC对话系统。然而,尽管AI语音…

作者头像 李华
网站建设 2026/4/14 15:14:06

EmotiVoice能否生成带有地方戏曲元素的语音?

EmotiVoice 能否生成带有地方戏曲元素的语音? 在虚拟人对话愈发自然、AI旁白几可乱真的今天,一个更深层的问题正在浮现:人工智能能否理解并再现那些根植于文化土壤中的声音艺术?比如中国地方戏曲中那抑扬顿挫的唱腔、千变万化的咬…

作者头像 李华