效果好了很多
但是提示词依然很难写。
第一套提示词:纯产品黑色绒布版
“【高端商业摄影工作流 - 几何重构与海报版】\n” “1.
核心目标:结合几何形变与高端海报视觉,打造极具吸引力的头花发圈商业大片。\n” “2.
产品提取与形变:精准抠取输入图中的头花产品,进行随机360度旋转、位置偏移、轴向斜切、局部扭曲及三维透视变换,使其以优雅的艺术角度(如倾斜或侧放)呈现。\n”
“3.
环境与道具搭建:将重构后的产品放置在高端摄影道具上(如质感柔软黑色丝绒衬垫)。关键要求:所有场景背景、衬托道具以及配饰的颜色与风格必须严格遵循核心头花的色系与样式(Color
Coordination),通过同色系或互补色的高级搭配,确保整体画面视觉和谐统一,衬托出核心产品的质感。\n” “4.
全面俯拍构图:采用绝对的俯视视角(Flat lay / Top-down
view),相机垂直于地面拍摄。头花产品、所有底衬道具(如大理石托盘、木质台面)以及装饰性配饰(鲜花、珠宝、首饰等)必须严格遵循统一的俯视透视逻辑,呈现平面铺贴展示效果。利用对角线或极简对称布局,将视觉重心锁定在头花的色彩与质感上。\n”
“5.
光影控制(含丁达尔):采用高光摄影棚布光,高光位精准点亮产品的明亮色泽。特别引入唯美的丁达尔效应,让柔和的微光束斜射在发圈的蓬松褶皱上,展现织物细腻的丝滑光泽感,光影通透且极具层次。\n”
“6. 最终产物:一款色彩极其鲜艳亮丽、具有顶级商业产品海报质感的极致细节展示图。整体风格需符合小红书(Little Red
Book)审美:画面明亮通透、色彩富有高级感、构图精致且充满生活美学气息,极其吸睛并具有高度的种草力。”
这是第一套的效果,我们在上图已经看到了。
然后我又加上了人物:
第二套提示词:人物佩戴展示版
“【顶级商业摄影 - 人物佩戴绝对保真版】\n” “1.
核心约束(最高优先级):1:1精确复刻图1的头花产品,不修改主体,不改变颜色,不添加装饰,写实产品,避免 AI 风格化篡改。\n” “2.
佩戴任务:将参考图1中的头花产品以自然的角度精准地佩戴在参考图2人物的头发上(如包裹在发髻、马尾周围)。要求佩戴位置合理,逻辑真实。可以进行整体的缩放或旋转以适配发型,但严禁局部扭曲或形状改动。\n”
“3. 人物与背景保持:保持参考图2中人物的所有特征,包括五官表情、眼镜、发色及整体气质,严禁对人物进行重塑或改变相貌。\n” “4.
完美融合:发丝与头花的边缘衔接需极度自然,呈现出真实的物理穿插感。环境光影需与人物当前环境完美融合。\n” “5.
视觉升华:添加一些丁达尔效应。”
完整代码
# coding:utf-8from__future__importprint_functionimportbase64importjsonimporttimeimportosfromvolcengine.visual.VisualServiceimportVisualServicedefimage_to_base64(image_path):withopen(image_path,'rb')asf:returnbase64.b64encode(f.read()).decode('utf-8')if__name__=='__main__':visual_service=VisualService()visual_service.set_ak('AK')visual_service.set_sk('SK==')# 1. 核心图片路径配置product_path='d:/save/hongfan/product.jpg'person_path='d:/save/hongfan/hur.jpg'# 人物图路径# 检查产品图是否存在ifnotos.path.exists(product_path):print(f"错误:产品图{product_path}不存在")exit()# 读取产品图product_base64=image_to_base64(product_path)# 判断是否有人物图has_person=os.path.exists(person_path)ref_image_list=[product_base64]ifhas_person:print("检测到人物图,将执行【人物佩戴展示】模式")person_base64=image_to_base64(person_path)ref_image_list.append(person_base64)# 第二套提示词:人物佩戴展示版workflow_prompt=("【顶级商业摄影 - 人物佩戴绝对保真版】\n""1. 核心约束(最高优先级):1:1精确复刻图1的头花产品,不修改主体,不改变颜色,不添加装饰,写实产品,避免 AI 风格化篡改。\n""2. 佩戴任务:将参考图1中的头花产品以自然的角度精准地佩戴在参考图2人物的头发上(如包裹在发髻、马尾周围)。要求佩戴位置合理,逻辑真实。可以进行整体的缩放或旋转以适配发型,但严禁局部扭曲或形状改动。\n""3. 人物与背景保持:保持参考图2中人物的所有特征,包括五官表情、眼镜、发色及整体气质,严禁对人物进行重塑或改变相貌。\n""4. 完美融合:发丝与头花的边缘衔接需极度自然,呈现出真实的物理穿插感。环境光影需与人物当前环境完美融合。\n""5. 视觉升华:添加一些丁达尔效应。")else:print("未检测到人物图,将执行【纯产品黑色绒布】模式")# 第一套提示词:纯产品黑色绒布版workflow_prompt=("【高端商业摄影工作流 - 几何重构与海报版】\n""1. 核心目标:结合几何形变与高端海报视觉,打造极具吸引力的头花发圈商业大片。\n""2. 产品提取与形变:精准抠取输入图中的头花产品,进行随机360度旋转、位置偏移、轴向斜切、局部扭曲及三维透视变换,使其以优雅的艺术角度(如倾斜或侧放)呈现。\n""3. 环境与道具搭建:将重构后的产品放置在高端摄影道具上(如质感柔软黑色丝绒衬垫)。关键要求:所有场景背景、衬托道具以及配饰的颜色与风格必须严格遵循核心头花的色系与样式(Color Coordination),通过同色系或互补色的高级搭配,确保整体画面视觉和谐统一,衬托出核心产品的质感。\n""4. 全面俯拍构图:采用绝对的俯视视角(Flat lay / Top-down view),相机垂直于地面拍摄。头花产品、所有底衬道具(如大理石托盘、木质台面)以及装饰性配饰(鲜花、珠宝、首饰等)必须严格遵循统一的俯视透视逻辑,呈现平面铺贴展示效果。利用对角线或极简对称布局,将视觉重心锁定在头花的色彩与质感上。\n""5. 光影控制(含丁达尔):采用高光摄影棚布光,高光位精准点亮产品的明亮色泽。特别引入唯美的丁达尔效应,让柔和的微光束斜射在发圈的蓬松褶皱上,展现织物细腻的丝滑光泽感,光影通透且极具层次。\n""6. 最终产物:一款色彩极其鲜艳亮丽、具有顶级商业产品海报质感的极致细节展示图。整体风格需符合小红书(Little Red Book)审美:画面明亮通透、色彩富有高级感、构图精致且充满生活美学气息,极其吸睛并具有高度的种草力。")# 循环生成4次foriinrange(1):print(f"正在生成第{i+1}张效果图...")form={"req_key":"jimeng_t2i_v40","prompt":workflow_prompt,"ref_image_list":ref_image_list,"seg_prompt":"头花",# 辅助模型识别产品"size":2048*2048,"scale":0.2,# 降低提示词影响,强制模型 1:1 参考输入图的细节"seed":-1,"force_single":True}try:resp=visual_service.cv_process(form)ifresp.get('code')==10000and'data'inrespand'binary_data_base64'inresp['data']:res_base64=resp['data']['binary_data_base64'][0]timestamp=int(time.time())output_path=f'd:/save/hongfan/result_{timestamp}_{i+1}.jpg'withopen(output_path,'wb')asf:f.write(base64.b64decode(res_base64))print(f"第{i+1}张效果已保存至{output_path}")else:print(f"第{i+1}张生成失败:{resp.get('message')ifrespelse'未知错误'}")exceptExceptionase:print(f"第{i+1}张调用发生异常(可能是服务器超时):{str(e)}")# 稍微延迟一下time.sleep(1)jimeng_t2i_v40 模型的优势哟劣势
| 维度 | 优势 | 劣势 |
|---|---|---|
| 文本理解与还原度 | 深度适配中文复杂指令,支持长文本、多条件约束(如“精准佩戴+光影融合+丁达尔效应”),能精准拆解多层级创作要求;对商业摄影类专业术语还原度高 | 对极小众场景/冷僻专业词汇的理解易出现偏差;多元素叠加(如同时要求产品保真+人物不变+光影特效)时,易忽略部分细节约束 |
| 画质与细节表现 | 生成图像分辨率最高支持4K,人物皮肤质感、发丝纹理、产品材质(如头花布料纹理)表现细腻;丁达尔效应等光影特效自然不违和 | 高分辨率下生成耗时较长(4K图约10-15秒/张);复杂纹理(如镂空蕾丝、渐变布料)偶有模糊或拼接感 |
| 人物&产品保真度 | 针对“产品复刻+人物保留”类需求做了专项优化,主体边缘抠图精准,减少非预期形变;支持1:1复刻指定产品特征 | 当产品与人物发丝/背景高度融合时,边缘衔接易出现轻微锯齿;极端角度(如俯视/仰视)下产品佩戴比例易失衡 |
| 风格适配与创意扩展 | 内置商业摄影、日系、复古等百余种风格模板,一键切换;支持光影特效(丁达尔效应)、氛围渲染的精准添加 | 创意同质化较明显,相同指令下生成结果相似度高;艺术化风格(如油画/水彩)的表现力弱于专业艺术向AI模型 |
| 生成效率与易用性 | 支持批量生成(单次最多10张候选图),新手友好,无需复杂参数调试;支持图生文+文生图联动创作 | 高复杂度指令下(多层约束+多特效),生成失败率略高(约5-8%);无参数自定义入口,专业用户无法精细化调整生成逻辑 |
| 商业场景适配性 | 针对电商主图、商业摄影、产品佩戴展示等场景做了深度优化,色彩还原贴近真实商品拍摄标准 | 不支持商业版权定制化输出;生成图像用于商用时,部分细节(如logo/品牌元素)需二次合规校验 |
最终终于给戴上了。