LongCat-Image-Editn多语言编辑能力：中英提示词混合使用（如‘Remove 水印, add slogan’）-开发者社区

LongCat-Image-Edit多语言编辑能力：中英提示词混合使用指南

1. 产品概述

LongCat-Image-Edit是美团LongCat团队推出的开源图像编辑模型，基于其文生图模型LongCat-Image的权重继续训练而成。这个仅6B参数的模型在多项编辑基准测试中达到了开源领域的顶尖水平。

核心优势：

中英混合编辑：支持"Remove 水印, add slogan"这类混合指令
精准区域保留：非编辑区域保持原样不变
中文文字插入：能准确在图片中添加中文文本
轻量高效：6B参数实现专业级编辑效果

2. 快速部署指南

2.1 镜像部署步骤

在星图平台选择LongCat-Image-Edit镜像进行部署
等待部署完成后，通过谷歌浏览器访问提供的HTTP入口
注意服务运行在7860端口

2.2 手动启动方法（备用）

若HTTP入口无法访问：

# 通过SSH或WebShell登录后执行 bash start.sh

看到"* Running on local URL: http://0.0.0.0:7860"提示即表示启动成功。

3. 中英混合编辑实战

3.1 基础编辑操作

访问测试页面后，上传待编辑图片（建议≤1MB，短边≤768px）
在提示词输入框填写编辑指令
点击"生成"按钮等待1-2分钟

3.2 中英混合指令示例

案例1：水印处理

Remove 水印，保持背景不变

案例2：文字添加

添加"限时促销"文字，change background to blue

案例3：对象替换

把图片主体中的猫变成dog，保持其他部分不变

4. 高级使用技巧

4.1 指令编写建议

明确主体：先指定要编辑的对象（如"主体"、"背景"、"左上角"）
动作清晰：使用简单动词（remove/add/change/replace）
语言混合：关键术语可用英文，描述性内容用中文
保持简洁：一句话说明核心修改需求

4.2 常见编辑场景

需求类型	示例指令	效果说明
对象移除	"Remove 路人，保持背景清晰"	精准移除指定对象
风格转换	"Change style to 水墨画"	整体风格转换
文字添加	"添加'欢迎光临'在顶部"	中文文字精准插入
颜色调整	"Make the sky more blue"	局部颜色增强

4.3 性能优化建议

图片尺寸控制在768px以内
复杂编辑可分步进行
夜间时段处理速度更快
重要编辑前先小图测试

5. 总结

LongCat-Image-Edit的中英混合编辑能力为图像处理提供了全新可能。通过简单的自然语言指令，用户可以：

实现精准的局部编辑
自由组合中英文表达需求
保持非编辑区域完美保留
快速获得专业级编辑效果

无论是去除不需要的元素、添加文字说明，还是改变图片风格，这个6B参数的轻量模型都能出色完成任务。其独特的语言混合理解能力，让图像编辑变得前所未有的简单直观。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

RMBG-2.0效果对比：同一张婚纱照，RMBG-2.0 vs Photoshop AI抠图细节

RMBG-2.0效果对比：同一张婚纱照，RMBG-2.0 vs Photoshop AI抠图细节 1. 引言：轻量级AI抠图工具的新选择在图像处理领域，背景去除一直是个高频需求。传统方法要么需要专业软件操作，要么效果不尽如人意。今天我们要对比…

李华

Ollama平台translategemma-12b-it保姆级使用教程

Ollama平台translategemma-12b-it保姆级使用教程 1. 你真的需要一个“能看懂图”的翻译模型吗？ 先别急着拉滚动条——花30秒想想这几个真实场景： 你收到一封带产品说明书截图的英文邮件，但截图里全是小字号表格和标注箭头，OCR识…

李华

Qwen3-TTS-12Hz-1.7B-CustomVoice实战教程：Prometheus+Grafana监控TTS服务指标

Qwen3-TTS-12Hz-1.7B-CustomVoice实战教程：PrometheusGrafana监控TTS服务指标 1. 引言语音合成技术正在快速改变我们与数字世界的交互方式。Qwen3-TTS-12Hz-1.7B-CustomVoice作为新一代语音合成模型，支持10种主要语言和多种方言风格，为全球…

李华

GLM-4-9B-Chat-1M多语言模型实战：手把手教你搭建智能对话系统

GLM-4-9B-Chat-1M多语言模型实战：手把手教你搭建智能对话系统 1. 为什么你需要一个支持100万字上下文的对话模型你有没有遇到过这样的场景： 客户发来一份50页的产品需求文档，还附带3个技术白皮书和2份历史会议纪要，然后问&…

李华

LFM2.5-1.2B-Thinking体验：内存不到1GB的惊艳文本生成

LFM2.5-1.2B-Thinking体验：内存不到1GB的惊艳文本生成导语：你有没有试过在一台只有4GB内存的老笔记本上，不联网、不装显卡驱动，点开浏览器就能和一个真正“会思考”的AI聊天？LFM2.5-1.2B-Thinking做到了——它不是简…

李华

OFA-VE实操手册：Gradio 6.0定制UI与透明化Log调试全解析

OFA-VE实操手册：Gradio 6.0定制UI与透明化Log调试全解析 1. 什么是OFA-VE：不只是视觉推理，更是一次人机交互体验升级 OFA-VE不是又一个跑通demo的模型包装工具。它是一个把“多模态理解能力”和“开发者友好性”真正拧在一起的实操系统——…

李华