FLUX.1-dev代码实例：Python调用Flask API实现批量文本→图像自动化生成-开发者社区

FLUX.1-dev代码实例：Python调用Flask API实现批量文本→图像自动化生成

1. 为什么需要批量调用FLUX.1-dev？——从手动点击到自动生产

你有没有试过在Web界面上反复输入提示词、点生成、等结果、再点下载……一上午只做了20张图？
这根本不是AI该有的效率。

FLUX.1-dev确实惊艳：光影真实得像电影截图，文字排版清晰可读，皮肤纹理细腻到能看清毛孔。但它的真正价值，从来不在单张图的惊艳，而在于稳定、可控、可编程的批量生产能力。

本镜像不是玩具，是为实际工作流设计的“绘图引擎”——它已预装Flask后端服务，开放标准HTTP接口，不依赖浏览器，不卡UI，不中断任务。你只需要写几行Python代码，就能让它整夜运行，自动生成上百张高质量图像，全部按命名规则存好、分类归档、甚至自动发到企业微信。

这不是“能不能调用”的问题，而是“怎么调得稳、调得快、调得省心”。

下面我们就从零开始，用最直白的方式，带你把FLUX.1-dev变成你脚本里的一个函数。

2. 接口准备：确认服务已就绪，无需额外部署

你不需要安装模型、不配置环境、不改代码——镜像启动即用。

当你在平台点击“启动镜像”后，系统会自动拉起一个本地Flask服务，默认监听http://127.0.0.1:7860（容器内）或平台映射出的公网HTTP地址（如https://xxx.csdn.ai）。这个地址就是你的“绘图工厂入口”。

验证是否就绪？直接在浏览器打开该地址，看到赛博朋克风格的WebUI界面，说明服务已活。
不确定端口？查看镜像控制台日志，搜索Running on http://即可找到准确URL。
没有公网地址？本地开发时，用curl -X GET "http://127.0.0.1:7860/health"测试返回{"status":"ok"}即表示API通道畅通。

这个Flask服务不是简易demo，它完整承载了FLUX.1-dev全部能力：

支持同步生成（等待结果返回）
支持异步队列（提交后轮询状态）
返回结构化JSON（含图片base64、文件名、耗时、参数）
自动管理显存（24G显存下fp16/bf16全精度稳定运行，无OOM）

你调用的不是“一个接口”，而是整套影院级绘图系统。

3. 核心调用：三段Python代码搞定一次生成

我们不用框架、不加装饰、不绕弯子。以下是最小可行代码，复制粘贴就能跑：

3.1 基础请求：发送提示词，获取图片

import requests import json import base64 from pathlib import Path # 替换为你实际的API地址（平台提供或本地localhost） API_URL = "https://xxx.csdn.ai" def generate_image(prompt, steps=20, cfg=3.5, width=1024, height=1024): payload = { "prompt": prompt, "steps": steps, "cfg_scale": cfg, "width": width, "height": height, "sampler_name": "dpmpp_2m_sde", "seed": -1 # -1 表示随机种子 } response = requests.post( f"{API_URL}/sdapi/v1/txt2img", json=payload, timeout=300 # 给足时间（FLUX生成1024x1024约需90秒） ) if response.status_code == 200: result = response.json() # 取第一张图（batch_size=1时仅一张） image_data = result["images"][0] return base64.b64decode(image_data) else: raise Exception(f"API error {response.status_code}: {response.text}") # 使用示例 if __name__ == "__main__": img_bytes = generate_image("A serene mountain lake at dawn, mist rising, pine trees, photorealistic, 8k") Path("output.jpg").write_bytes(img_bytes) print(" 图片已保存为 output.jpg")

这段代码干了什么？

直接POST到标准Stable Diffusion API兼容路径/sdapi/v1/txt2img
传入你熟悉的参数：prompt、steps、cfg_scale、尺寸
自动解码base64，返回原始字节流，可直接写入文件
超时设为300秒，避免因FLUX高精度计算被误判超时

小贴士：FLUX对英文提示词理解更准。中文描述建议用"Chinese ink painting of..."这类结构，或先用翻译工具润色成自然英文。

3.2 批量生成：循环调用，自动命名，防错重试

单张只是开始。真正提升效率的是批量：

import time import random def batch_generate(prompts, output_dir="batch_output", delay=2): Path(output_dir).mkdir(exist_ok=True) for i, prompt in enumerate(prompts, 1): try: print(f"🖼 正在生成第 {i}/{len(prompts)} 张：{prompt[:50]}...") img_bytes = generate_image(prompt) # 用提示词前15字符+序号命名，安全去符号 safe_name = "".join(c for c in prompt[:15] if c.isalnum() or c in " _-") filename = f"{output_dir}/{i:03d}_{safe_name}.png" Path(filename).write_bytes(img_bytes) print(f" 已保存：{filename}") except Exception as e: print(f" ❌ 失败：{e}") # 记录失败项，继续下一张 with open(f"{output_dir}/failed_prompts.txt", "a") as f: f.write(f"[{i}] {prompt}\n") # 每张之间加短暂停顿，减轻服务压力 if i < len(prompts): time.sleep(delay + random.uniform(0, 1)) # 使用示例：生成5张不同风格的图 prompts = [ "A cyberpunk street at night, neon signs reflecting on wet pavement, cinematic lighting, ultra-detailed", "An ancient library with floating books and glowing runes, warm ambient light, fantasy realism", "Close-up of a chef's hands preparing sushi, fresh ingredients, shallow depth of field, food photography", "Minimalist white studio shot of a ceramic vase, soft shadows, clean background, product photo", "A fox sitting on a mossy rock in foggy forest, morning light, photorealistic wildlife" ] batch_generate(prompts)

这段代码的关键设计：

自动防崩：单张失败不影响整体流程，错误记录到文件
智能命名：截取提示词关键词，避免Windows非法字符（< > : " / \ | ? *）
节奏可控：delay参数调节请求间隔，2秒足够，不压垮服务
目录隔离：所有输出归入batch_output/，清爽不混乱

3.3 进阶控制：获取耗时、种子、参数，用于复现与分析

FLUX生成不只是出图，还附带关键元数据。这些信息对质量回溯、AB测试、参数调优至关重要：

def generate_with_info(prompt, **kwargs): payload = {"prompt": prompt, **kwargs} response = requests.post(f"{API_URL}/sdapi/v1/txt2img", json=payload) if response.status_code == 200: result = response.json() image_data = base64.b64decode(result["images"][0]) # 提取关键信息 info = json.loads(result["info"]) metadata = { "prompt": info["prompt"], "seed": info["seed"], "steps": info["steps"], "cfg_scale": info["cfg_scale"], "model_hash": info.get("model_hash", "unknown"), "generation_time_sec": info["elapsed_time"], "timestamp": info["datetime"] } return image_data, metadata else: raise Exception(response.text) # 使用示例 img, meta = generate_with_info( "A steampunk airship flying over Victorian London, detailed brass gears, volumetric clouds", steps=30, cfg=4.0, width=1280, height=720 ) print("⏱ 生成耗时：", meta["generation_time_sec"], "秒") print("🌱 随机种子：", meta["seed"]) print("⚙ 实际参数：", f"Steps={meta['steps']}, CFG={meta['cfg_scale']}") Path("steampunk_airship.png").write_bytes(img)

返回的metadata字典里，你拿到了：

真实使用的seed（可完全复现同一张图）
精确到毫秒的generation_time_sec（评估性能瓶颈）
完整prompt（含WebUI自动补全部分）
model_hash（确认调用的是FLUX.1-dev而非其他模型）

这些不是“锦上添花”，而是工程化落地的基石。

4. 稳定性保障：24G显存下的长期运行实践

你可能会担心：连续跑100张，会不会某次突然OOM？GPU温度飙升？服务卡死？

答案是：不会。这是本镜像针对RTX 4090D（24G显存）深度优化的核心价值。

4.1 显存保护机制如何工作？

FLUX.1-dev原生参数量达12B，全载入显存需远超24G。本镜像通过两项关键技术实现“稳如磐石”：

Sequential Offload（串行卸载）：将模型分层加载，计算一层、卸载一层、再加载下一层。显存占用峰值始终控制在18GB以内，留足缓冲。
Expandable Segments（可扩展分段）：动态管理CUDA内存池，主动合并碎片，避免因多次分配/释放导致的“明明有空闲却报OOM”。

实测数据：在24G显存的RTX 4090D上，连续生成100张1024x1024图像，显存占用曲线平稳在16–18GB区间，无一次OOM，无一次重启。

4.2 你的代码该如何配合？

你不需要改模型代码，只需在调用层做两件事：

设置合理超时：FLUX单图生成通常90–150秒（取决于尺寸和步数），timeout=300足够且安全；
添加重试逻辑（可选）：网络抖动可能偶发502，加一层简单重试即可：

from tenacity import retry, stop_after_attempt, wait_fixed @retry(stop=stop_after_attempt(3), wait=wait_fixed(5)) def robust_generate(prompt): return generate_image(prompt)

（需安装pip install tenacity）

稳定性不是靠运气，而是靠设计。你写的每一行调用代码，都运行在已被验证的坚实基座之上。

5. 实战场景：三个真实可用的自动化工作流

光会调用不够，要解决真问题。以下是三个开箱即用的工作流模板，你可直接修改使用。

5.1 场景一：电商主图批量生成（带背景替换）

需求：为100款新品自动生成“纯白背景+产品居中+阴影”的主图。

def generate_product_main_image(product_name, color="white"): prompt = f"Professional product photography of {product_name}, isolated on pure {color} background, soft shadow, studio lighting, 8k" img_bytes = generate_image(prompt, width=1200, height=1200) return img_bytes # 批量处理CSV中的商品列表 import pandas as pd df = pd.read_csv("products.csv") # 含 "name" 列 for _, row in df.iterrows(): img = generate_product_main_image(row["name"]) Path(f"main_images/{row['name'].replace(' ', '_')}.jpg").write_bytes(img)

优势：告别PS手动抠图，1小时生成100张合规主图。

5.2 场景二：社交媒体配图自动化（按主题轮播）

需求：每天早8点自动发布一张“励志金句+风景图”，持续30天。

import schedule import time QUOTES = [ ("The future belongs to those who believe in the beauty of their dreams.", "starry night sky over mountains"), ("Success is not final, failure is not fatal: it is the courage to continue that counts.", "ocean sunrise with lone boat") ] def post_daily_image(): quote, scene = random.choice(QUOTES) prompt = f"Beautiful landscape of {scene}, elegant typography overlay: '{quote}', minimalist, high contrast, cinematic" img = generate_image(prompt, width=1080, height=1350) # 适合小红书/Instagram竖图 # 此处接入你的发布SDK（如微博API、微信公众号素材上传） upload_to_social_media(img, quote) schedule.every().day.at("08:00").do(post_daily_image) while True: schedule.run_pending() time.sleep(60)

优势：内容+视觉全自动，运营人力节省90%。

5.3 场景三：A/B测试提示词效果（量化对比）

需求：对比两组提示词（A组强调“质感”，B组强调“氛围”），看哪组生成图点击率更高。

def ab_test_prompts(base_desc, variants): results = {} for name, suffix in variants.items(): prompt = f"{base_desc}, {suffix}" _, meta = generate_with_info(prompt, steps=25) results[name] = { "prompt": prompt, "time_sec": meta["generation_time_sec"], "seed": meta["seed"] } return results # 测试同一主体的不同表达 variants = { "texture_focus": "ultra-detailed skin texture, subsurface scattering, 100mm macro lens", "mood_focus": "dreamy atmosphere, soft bokeh, golden hour lighting, emotional depth" } ab_results = ab_test_prompts("Portrait of a young woman with curly hair", variants) print(json.dumps(ab_results, indent=2))

优势：用真实生成耗时、种子、参数，支撑设计决策，告别主观猜测。