news 2026/5/23 18:49:05

开源神器!一句话生成完整短剧,从剧本到成片全自动化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
开源神器!一句话生成完整短剧,从剧本到成片全自动化

告别"抽卡式"AI视频生成,这款工具让你像专业导演一样掌控每一帧


前言

你是否有过这样的困扰?

  • 用 AI 生成视频,角色一换镜头就"变脸"

  • 想做一个完整的短剧,但每个镜头都要单独生成,效率极低

  • 生成的画面无法控制,完全是"开盲盒"

今天给大家介绍一款开源项目 ——BigBanana AI Director(AI 漫剧工场),它采用工业化的工作流,让你从"灵感"到"成片"一气呵成!


项目简介

BigBanana AI Director是一个 AI 一站式短剧/漫剧生成平台,专为创作者打造。

它最大的特点是摒弃了传统的"抽卡式"生成,采用"Script-to-Asset-to-Keyframe"(剧本-资产-关键帧)的工业化工作流:

一句话生成完整短剧
角色一致性保障—— 不再"换脸"
场景连续性控制—— 告别"穿帮"
精准镜头运动—— 像专业导演一样掌控每一帧


核心亮点

🎬 关键帧驱动,告别"开盲盒"

传统 AI 视频生成的痛点是:你只能输入一段文字,然后祈祷 AI 给你一个满意的结果。

BigBanana 引入了动画制作中的关键帧(Keyframe)概念:

  1. 先画后动:先生成精准的起始帧和结束帧

  2. 插值生成:AI 在两帧之间生成平滑的视频过渡

  3. 资产约束:所有画面都受到"角色定妆照"和"场景概念图"的约束

这意味着你可以精确控制每个镜头的开始和结束状态,彻底告别"开盲盒"!

👥 角色一致性系统

这是很多创作者最头疼的问题 —— AI 生成的角色,换个镜头就变了个人。

BigBanana 的解决方案:

  • 定妆照系统:为每个角色生成标准参考图

  • 衣橱系统:支持多套造型(日常、战斗、受伤等),基于 Base Look 保持面部特征一致

  • 上下文感知:生成镜头时自动读取角色和场景信息

🎯 四阶段工业化流程

整个创作流程被拆分为四个清晰的阶段:

阶段功能说明
Phase 01剧本与分镜输入故事,AI 自动拆解为标准剧本结构
Phase 02资产与选角生成角色定妆照和场景概念图
Phase 03导演工作台网格化管理所有镜头,精准控制关键帧
Phase 04成片导出时间轴预览,一键导出

功能演示

1️⃣ 项目管理

首先,你可以在项目管理页面创建和管理你的短剧项目。

项目管理

[截图说明:项目列表页面,展示多个项目卡片,包含项目名称、创建时间、进度状态等信息]

2️⃣ Phase 01:剧本与分镜

输入你的故事创意或小说片段,AI 会自动:

  • 拆解为标准剧本结构(场次、时间、气氛)

  • 生成分镜脚本

  • 将文字描述转化为专业的图像提示词

剧本创作

剧本与故事

[截图说明:分镜详情页面,展示每个镜头的画面描述、角色、台词等信息]

3️⃣ Phase 02:角色与场景资产

这一步是保证角色一致性的关键!

  • 为每个角色生成"定妆照"作为参考

  • 支持多套服装造型

  • 生成场景概念图,确保光影统一

角色场景

场景

4️⃣ Phase 03:导演工作台

这是整个系统的核心!

  • 网格化分镜表:全景式管理所有镜头

  • 关键帧编辑:精确控制每个镜头的起始帧和结束帧

  • 上下文感知:AI 自动读取角色和场景信息,解决"不连戏"问题

  • 视频生成:支持 Image-to-Video 和关键帧插值两种模式

导演工作台

镜头与帧

镜头与帧1

5️⃣ Phase 04:成片导出

最后一步,预览和导出你的作品:

  • 时间轴形式预览整个短剧

  • 实时监控渲染进度

  • 支持导出高清关键帧和 MP4 片段

成片导出

📝 提示词管理

系统还提供了提示词管理功能,方便你查看和编辑 AI 生成的提示词:

提示词管理


技术架构

模块技术选型
前端框架React 19 + Tailwind CSS
文本模型GPT-5.1(剧本分析)
图像模型Gemini 3 Pro(高速绘图)
视频模型Veo 3.1 / Sora 2(关键帧插值)
数据存储IndexedDB(本地存储,隐私安全)

亮点:所有数据存储在本地浏览器,无需后端服务器,你的创意完全属于你自己!


快速开始

方式一:本地开发

# 克隆项目 git clone https://github.com/shuyu-labs/BigBanana-AI-Director.git cd BigBanana-AI-Director # 安装依赖 npm install # 启动开发服务器 npm run dev # 访问 http://localhost:3000

方式二:Docker 部署(推荐)

# 克隆项目 git clone https://github.com/shuyu-labs/BigBanana-AI-Director.git cd BigBanana-AI-Director # 一键启动 docker-compose up -d --build # 访问 http://localhost:3005

使用步骤

  1. 配置 API Key:启动应用后,输入 AntSK API Key

  2. 输入故事:在 Phase 01 输入你的故事创意

  3. 生成资产:在 Phase 02 生成角色定妆照和场景图

  4. 制作分镜:在 Phase 03 逐个生成镜头关键帧

  5. 导出成片:在 Phase 04 预览并导出


为什么选择 AntSK API?

本项目深度集成AntSK API 平台,提供极致性价比的 AI 能力:

🎯全模型覆盖:GPT-5.2、Claude 3.5、Gemini 3 Pro、Sora 2、Veo 3.1
💰超值定价:所有模型价格低于官方 80%
🚀开发者友好:OpenAI 兼容协议,零迁移成本

👉 立即注册领取免费额度


项目地址

GitHub:https://github.com/shuyu-labs/BigBanana-AI-Director

⭐ 如果觉得有用,欢迎 Star 支持!


写在最后

BigBanana AI Director 的目标是让每个人都能成为"导演",用 AI 的力量将脑海中的故事变成现实。

无论你是想做短视频、漫剧、还是动画预览,这个工具都能帮你大幅提升效率。

开源地址:https://github.com/shuyu-labs/BigBanana-AI-Director

欢迎 Star、Fork、提 Issue,一起让这个项目变得更好!


Built for Creators, by BigBanana.

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/23 15:55:26

数字图像处理篇---形态学梯度

一句话比喻 形态学梯度就像给物体的边缘“描金边”:用膨胀的“外扩版”减去腐蚀的“内缩版”,剩下的就是闪闪发光的轮廓线。 核心思想:边缘 膨胀 - 腐蚀 形态学梯度不是新操作,而是用膨胀结果减去腐蚀结果: 梯度图 …

作者头像 李华
网站建设 2026/5/22 15:18:44

开发报销单自动填写工具,导入发票信息(金额,日期,品类),自动填充报销单,核对无误后导出,支持按公司规范调整,节省报销时间。

1. 实际应用场景描述 场景: 小李是一名市场专员,每月要处理大量差旅、采购发票,手动填写报销单非常繁琐,容易出错。公司报销单有固定格式,但每次都要重新输入金额、日期、品类,还要按部门、项目分类&#x…

作者头像 李华
网站建设 2026/5/22 9:30:25

智能街景识别之门头识别 广告牌识别 智慧城市治理 街道门头治理 广告图像识别第10476期 YOLO格式+voc图像格式 深度学习

数据集说明 往期热门主题 主页搜两字"关键词"直达 代码数据获取: 获取方式:***文章底部卡片扫码获取***. 覆盖了YOLO相关项目、OpenCV项目、CNN项目等所有类别, 覆盖各类项目场景: 项目名称项目名称基于YOLOv8 智慧…

作者头像 李华