Z-Image-Turbo_UI界面详解:每个按钮都帮你搞明白
你已经成功部署了Z-Image-Turbo的WebUI镜像,浏览器里打开 http://localhost:7860 就能看到那个简洁又充满科技感的界面。但面对一排排按钮、滑块和输入框,是不是有点懵?“这个‘Generate’到底点不点?”“‘Upload Image’传什么图才对?”“下面那串数字是干啥的?”别急——这篇文章不讲安装、不跑命令、不堆参数,就盯着界面上每一个可见元素,用大白话告诉你:它是什么、你该不该动、怎么动才不翻车。
这不是一份功能说明书,而是一张你打开网页后立刻能用上的“操作地图”。我们按你眼睛看到的顺序,从上到下、从左到右,一个控件一个控件拆解,连那个不起眼的小图标都给你说清楚。
1. 界面整体布局与访问方式
Z-Image-Turbo_UI 是一个基于 Gradio 框架构建的本地 Web 应用,所有交互都在浏览器中完成,无需额外客户端或插件。它的核心逻辑非常直接:你输入描述 → 它生成图像 → 你查看/保存/再调整。
1.1 如何正确打开界面
启动服务后,终端会输出类似这样的提示:
Running on local URL: http://127.0.0.1:7860这时,请务必在本机浏览器中打开http://localhost:7860或http://127.0.0.1:7860(两者完全等价)。
注意:不要复制粘贴带https://的链接,也不要尝试用手机扫码访问——这个界面只支持本地回环地址,且未启用远程共享。
如果你在终端看到一个https://xxxx.gradio.live的链接,那是 Gradio 的公共分享地址,本镜像默认未开启该功能,强行访问会失败。请认准http://localhost:7860这个地址。
1.2 界面三大功能区划分
整个页面清晰分为三个纵向区域:
- 左侧主操作区:包含提示词输入、参数调节、生成控制按钮,是你最常打交道的地方;
- 右侧预览与历史区:实时显示生成结果,并提供历史图片缩略图浏览;
- 底部状态与工具栏:显示当前运行状态、模型加载信息、以及快速清空/重置入口。
这种布局不是随意设计的——它对应着你实际使用的三步节奏:想清楚(左)→ 做出来(左)→ 看效果(右)→ 再优化(左)。
2. 左侧主操作区:从提示词到生成按钮,逐个击破
这是你每天点击最多、也最容易误操作的区域。我们不按“高级/基础”分类,而是按你视线自然移动的顺序,从上往下看。
2.1 提示词输入框(Prompt)
位置:顶部第一个大文本框,标签为"Prompt",下方有浅灰色提示文字:“Enter a prompt (e.g., a cat wearing sunglasses)”
它是干啥的?
你告诉模型“想要什么图”的地方。一句话、一段描述、甚至几个关键词都行。比如:“一只橘猫坐在窗台,阳光斜射,毛发泛光,写实风格”。小白友好建议:
- 中文完全可用,且理解准确,不用硬翻英文;
- 多用具体名词+形容词组合(“玻璃杯”比“容器”好,“青花瓷纹样”比“传统图案”好);
- 避免抽象概念(如“孤独”“希望”),换成可画的元素(“一个人影背对镜头站在空旷雪地”);
- 不用写“高清”“4K”——模型默认输出高质量,加这些词反而可能干扰风格判断。
小技巧:
输入时按Ctrl+Enter(Windows/Linux)或Cmd+Enter(Mac)可直接触发生成,省去点按钮动作。
2.2 负向提示词框(Negative Prompt)
位置:紧挨在 Prompt 下方,标签为"Negative prompt",默认为空。
它是干啥的?
明确告诉模型“绝对不要出现什么”。不是“不想要”,而是“禁止出现”。比如你不想图里有文字、水印、畸形手、多手指、模糊背景,就全写在这儿。常用负向词参考(直接复制可用):
text, watermark, signature, username, blurry, low quality, jpeg artifacts, cropped, worst quality, low resolution, extra fingers, mutated hands, deformed face, bad anatomy关键提醒:
别空着!哪怕只填text, watermark,也能显著提升成品干净度。它不像 Prompt 那样需要创意,更像是给模型划一条安全线。
2.3 图像尺寸选择器(Width × Height)
位置:在负向提示词下方,两个并排的数字输入框,分别标有"Width"和"Height",默认值通常是1024 × 1024。
它是干啥的?
设定最终生成图片的像素宽高。不是“放大缩小”,而是“从零生成多大的图”。怎么选才合理?
尺寸组合 适用场景 注意事项 512 × 512快速测试、草图构思、批量试错 速度最快,细节较弱 1024 × 1024日常使用、社交配图、设计初稿 平衡速度与质量,推荐首选 1280 × 720视频封面、横版海报 宽高比固定,避免拉伸变形 2048 × 2048打印输出、高清展板 显存占用翻倍,需确保GPU够用 重要原则:
宽高数值必须是64 的整数倍(如 512、768、1024、1280、2048),否则系统会自动向下取整到最近的合法值,且不提示。
2.4 生成步数(Steps)
位置:尺寸下方,一个滑动条,标签为"Steps",默认值为8。
它是干啥的?
控制模型“画多少遍”来完善图像。Z-Image-Turbo 的核心优势就是“少步数出好图”,8 步是其黄金平衡点。你能改吗?
可以,但强烈建议保持默认 8。- 改成 4–6:速度更快,但细节易丢失、边缘易糊;
- 改成 10–12:细节稍增,但耗时延长 30% 以上,且可能引入噪点或过平滑;
- 改成 16+:完全违背 Z-Image-Turbo 的设计哲学,效果未必更好,纯属浪费算力。
一句话总结:
这个滑块存在的意义,不是让你调优,而是让你理解——它天生就很快,快得不需要你操心。
2.5 CFG Scale(提示词相关性)
位置:Steps 下方,另一个滑动条,标签为"CFG Scale",默认值为7。
它是干啥的?
决定模型“多听话”。数值越高,生成图越严格贴合你的提示词;数值越低,模型越自由发挥,可能更艺术、但也更不可控。新手推荐区间:
5–7:宽松自然,适合创意发散、风格探索;7–10:精准可靠,日常生成首选,兼顾准确性与画面美感;10–12:强约束,适合需要精确还原特定物体/构图的场景(如产品图);>12:慎用!容易导致画面僵硬、色彩失真、细节崩坏。
实用口诀:
“先用 7,不满意再微调 ±2;调完没改善,回头检查提示词。”
2.6 随机种子(Seed)
位置:CFG Scale 下方,一个数字输入框,标签为"Seed",默认显示-1。
它是干啥的?
相当于图像的“DNA编号”。相同提示词 + 相同 Seed = 100% 重复生成同一张图。-1是什么意思?
表示“每次生成都用新随机数”,也就是默认开启随机模式。你点一次“Generate”,它就换一张。什么时候要改它?
- 你想复现某张特别喜欢的图 → 把当时生成的 Seed 数字抄下来,下次粘贴进去,再点生成;
- 你想做微调对比(比如只改 CFG Scale,其他全一样)→ 先记下当前 Seed,再调整参数重试。
小技巧:
点击 Seed 输入框右侧的🎲图标,可一键生成新随机数,比手动输更快。
2.7 上传图像区域(Upload Image)
位置:Seed 下方,一个带虚线边框的矩形区域,标签为"Upload Image",内有文字:“Drag & drop or click to upload”。
它是干啥的?
启用“图生图”(img2img)模式。上传一张参考图后,模型会在保留其构图、主体、大致风格的基础上,按你的 Prompt 重新绘制。传什么图最合适?
- 手绘线稿、PSD 分层图、手机随手拍的构图参考;
- 清晰主体、背景简洁的图(复杂背景会干扰重绘);
- 分辨率不必太高,512×512 足够,太大反而拖慢处理。
上传后会发生什么?
区域内会显示缩略图,并自动激活下方的"Image Strength"滑块(控制原图影响强度,默认 0.5)。此时你再输入 Prompt,生成的就是“基于这张图的再创作”。注意:
如果你没上传图,这个区域就是摆设,不影响正常文生图流程。
2.8 生成按钮(Generate)
位置:最底部,一个醒目的蓝色大按钮,文字为"Generate"。
它是干啥的?
终极执行键。点它,模型开始推理,几秒后右侧预览区就会出现结果。点之前务必确认三件事:
- Prompt 框里写了你想表达的内容(哪怕只有 3 个词);
- Negative prompt 至少填了
text, watermark; - 尺寸、步数、CFG 值都在合理范围内(不用纠结完美,先出图再说)。
点之后别乱动:
按钮会变成灰色并显示 “Generating…”。此时切勿刷新页面、关闭浏览器、或重复点击——所有操作都会中断当前任务,且无法恢复。
3. 右侧预览与历史区:不只是看图,更是工作流枢纽
这里不是静态展示墙,而是你创作闭环的关键一环。
3.1 实时生成预览区(Output Image)
位置:右侧上方,一个大方形区域,标签为"Output Image",初始为灰色占位图。
它怎么工作?
一旦你点击 Generate,此处会实时更新为生成结果。如果是图生图,还会叠加显示原图缩略图(小角标形式)。你能做什么?
- 鼠标悬停:显示完整分辨率(如
1024x1024)和生成耗时(如0.83s); - 右键另存为:直接保存到本地电脑;
- 点击放大:在新标签页打开高清图,方便细节检查。
- 鼠标悬停:显示完整分辨率(如
重要提示:
此处显示的是最终输出图,已自动去除水印、裁剪、锐化等后处理。所见即所得。
3.2 历史图片画廊(History Gallery)
位置:预览区正下方,一排横向滚动的缩略图,标签为"History"。
它存的是什么?
所有通过本界面成功生成的图片,按时间倒序排列(最新在最左)。每张缩略图右下角有生成时间戳(小时:分钟)。如何查看全部?
滚动条可左右拖动;鼠标悬停缩略图,会浮现完整文件名(如zimage_20240520_142231.png);点击任意缩略图,即可在上方预览区放大查看。如何管理历史?
- 删除单张:悬停缩略图,右上角出现 × 图标,点击即可删除(同时清空磁盘文件);
- 清空全部:点击画廊右上角的"Clear History"按钮(红色文字),确认后所有记录与文件一并清除。
技术真相:
这些图片真实存放路径是~/workspace/output_image/,你也可以在终端用ls ~/workspace/output_image/查看,或用rm -rf *批量清理——但用界面上的按钮更安全、更直观。
4. 底部状态与工具栏:那些被忽略却很关键的细节
常被快速滑过,但它们默默保障着你的每一次生成稳定可靠。
4.1 模型状态栏(Status Bar)
位置:页面最底部,细长灰条,文字如:“Model loaded successfully | GPU: NVIDIA A100 | VRAM: 12.4GB / 20GB”。
它告诉你什么?
- 左侧:模型是否就绪(“Model loaded successfully”= 可用;若显示“Loading…”则需等待);
- 中部:当前 GPU 型号;
- 右侧:显存占用情况,实时反映负载压力。
为什么值得关注?
如果 VRAM 占用长期 >95%,后续生成可能变慢、卡顿甚至失败。此时建议:- 降低图像尺寸(如从 1024×1024 改为 768×768);
- 关闭其他占用 GPU 的程序(如 Chrome 多开标签页、其他 AI 工具);
- 清空历史(释放缓存)。
4.2 快速重置按钮(Reset All)
位置:状态栏左侧,一个带循环箭头图标的按钮,标签为"Reset All"。
它是干啥的?
一键将所有参数恢复为默认值:Prompt 清空、Negative prompt 清空、尺寸复位 1024×1024、Steps 回 8、CFG 回 7、Seed 变 -1、上传图移除。什么时候用它?
- 开始新项目前,快速清场;
- 参数调乱了不知所措,一键回到起点;
- 想彻底换个思路,不带任何历史包袱。
不是“撤销”:
它不会撤回上一次生成,也不会删除历史图片,只重置左侧所有输入和设置。
5. 总结:你现在已经掌握了全部主动权
读完这篇,你不再需要对着界面猜、靠试错学、或翻文档查。Z-Image-Turbo_UI 的每一个可见元素,你都知道:
- 它叫什么、在哪、长什么样;
- 它真正的作用是什么,而不是文档里的术语翻译;
- 你该不该动它、什么时候动、怎么动最安全高效;
- 它背后藏着哪些实用技巧和避坑指南。
这就像拿到一辆新车的驾驶手册——不是教你造发动机,而是让你今天就能上路,开得稳、开得顺、开得明白。
接下来,你可以:
- 用
Prompt + Negative prompt + 1024×1024 + Steps 8 + CFG 7这套组合,生成 5 张不同主题的图,建立手感; - 尝试上传一张自己的照片,把“图生图”玩起来;
- 在 History 里挑一张喜欢的,记下它的 Seed,然后只改 CFG 到 9 和 11,看看变化;
- 把常用负向词存成文本片段,以后一键粘贴。
Z-Image-Turbo_UI 的设计哲学,从来不是“功能越多越好”,而是“把最常用的 20% 做到极致简单”。你现在看到的每一个按钮,都是经过千次迭代后留下的确定答案。放心用,大胆试,剩下的,交给它。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。