news 2026/3/13 19:55:14

告别抽卡式AI视频,这个开源项目让剧本一键变成片!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
告别抽卡式AI视频,这个开源项目让剧本一键变成片!

你有没有试过:熬夜写完3000字剧本,想用AI生成视频,结果男主角每帧换一张脸,前一秒在咖啡厅、下一秒跳到火星,连戏?不存在的。反复抽卡100次,只能含泪发朋友圈:"AI虽好,可惜不听话。"

我也被这个问题折磨了很久。所以花了几个月时间,做了一个完全开源的项目,分享给大家——


BigBanana AI Director(AI 短剧/漫剧工场)

GitHub:https://github.com/shuyu-labs/BigBanana-AI-Director

一句话概括:把你的故事文本变成可控的视频成片,全程不掉链子。

它不是让AI随机"抽卡"出画面,而是模拟真实影视制作流程——先定妆、再搭景、然后画分镜、最后合成片。每个环节你都能干预,每帧画面都受约束,告别"薛定谔的男主角"。

完全开源,免费使用,代码随便看。希望能帮到同样在折腾AI视频的朋友们。

项目管理

它能做什么?

🎬 功能一:智能剧本拆解

场景:你有一篇5000字的小说片段,想做成3分钟短剧。

效果:粘贴进去,AI自动拆成"场景→镜头→台词"的标准分镜表,还能设定目标时长,它帮你规划节奏密度。不用手动分段,省下2小时。

剧本创作

🎭 功能二:角色定妆 + 衣橱系统

场景:男主要有"日常装"和"战斗装"两套造型,但脸不能变。

效果:先生成一张"定妆照"作为基准,再基于它生成不同服装变体。所有后续画面都参考这张脸,彻底锁死五官,换衣服不换人。

角色场景

🖼️ 功能三:关键帧驱动的视频生成

场景:你要一个"男主回头"的镜头,普通AI随便动动就糊弄你。

效果:先画起始帧(正面)和结束帧(回头状态),再让Veo模型在两帧之间"补间"出丝滑动画。起点终点你说了算,过程AI帮你填。

导演工作台

📦 功能四:一键导出 + 渲染追踪

场景:生成了20个镜头,想批量导出去Premiere剪辑。

效果:时间轴预览全部片段,一键导出高清关键帧和MP4视频,还能实时看渲染进度。专业后期无缝衔接。

成片导出

✏️ 功能五:全流程手动微调

场景:AI生成的分镜提示词有点跑偏,想手动改几个词。

效果:每个分镜的角色列表、动作描述、画面提示词都能直接编辑。AI打底,人类精修,控制权始终在你手里。

镜头与帧

技术架构一览

整体架构可以简化为三层:

┌─────────────────────────────────────────────────┐ │ 输入层:剧本/故事文本 │ │ ↓ GPT-5.1 智能拆解 │ ├─────────────────────────────────────────────────┤ │ 资产层:角色定妆照 + 场景概念图 │ │ ↓ Gemini 3 Pro 约束生成 │ ├─────────────────────────────────────────────────┤ │ 输出层:关键帧 → Veo/Sora 视频插值 → MP4成片 │ └─────────────────────────────────────────────────┘

设计巧思

  • "约束优先"而非"随机生成":每帧画面都必须参考角色图和场景图,杜绝AI自由发挥

  • 纯前端架构:React 19 + IndexedDB 本地存储,数据不离开你的浏览器,隐私无忧

  • 统一API调度:通过AntSK接口一站式调用文本/图像/视频模型,不用切换多个平台


3步快速上手

步骤

操作

时间

访问项目,配置API Key

1分钟

粘贴故事 → 点击"生成分镜脚本"

30秒

进入导演台 → 批量生成关键帧和视频

按需

代码仓库:https://github.com/shuyu-labs/BigBanana-AI-Director
在线体验:https://bigbanana.tree456.com/
API获取:https://api.antsk.cn/ (新用户有免费额度)


为什么开源?

做这个项目的初衷很简单:让没有影视制作经验的人,也能把脑子里的故事变成视频。

AI视频这个领域变化太快,一个人闭门造车肯定跟不上。开源出来,大家一起迭代,才能做得更好。

接下来计划做的功能:

  • 🔊 AI配音与口型同步

  • 🎵 BGM智能匹配

  • 📱 移动端适配

欢迎提Issue、提PR,或者单纯来聊聊你的想法。


📱 加入微信交流群

我建了一个AI漫剧创作交流群,群里有:

  • 第一时间的功能更新通知

  • 遇到问题可以直接问我

  • 和其他创作者交流经验、分享作品

  • 不定期分享AI视频创作技巧

扫码加群,一起交流:

微信群二维码

最后

👀 先看看
点击「阅读原文」访问GitHub仓库,代码、文档、演示全都有

⭐ 觉得有用?
给项目点个Star,也欢迎分享给有需要的朋友

🚀 动手试试
在线体验:https://bigbanana.tree456.com/

有任何问题,群里见!


#AI视频#开源项目#AIGC#短剧制作#效率工具

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/12 23:57:53

UVM-override与sequence的多态特性使用

Exploiting Sequence Polymorphism 上述示例展示了,UVM中利用序列多态性(Sequence Polymorphism)来实现测试场景随机化与自动化的高级技巧,其核心思想、实现方法及优势如下: 核心思想 通过定义一个通用的序列基类(图中为 bus_seq_base),让所有具体测试序列(如 rw_in…

作者头像 李华
网站建设 2026/3/9 15:45:13

块压缩解码实战:ETC1/ETC2详解

你可以把 GPU 纹理压缩想象成一件非常“抠门但聪明”的事: 手机显存就那么点,带宽也紧张,GPU 还得每秒采样几十亿次纹理。于是工程师们想了个办法——“别把每个像素老老实实存 RGBA 四个通道了,太费。 咱们一小块一小块地存&…

作者头像 李华
网站建设 2026/3/9 5:46:32

基于SpringBoot的校园一卡通系统毕设

博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。一、研究目的本研究旨在设计并实现一个基于SpringBoot框架的校园一卡通系统,以满足现代校园对高效、便捷、安全的一卡通服务需求。具体研究目的如下: …

作者头像 李华
网站建设 2026/3/10 9:08:52

基于Springboot+Vue的物品租赁管理系统源码文档部署文档代码讲解等

课题介绍 本课题旨在设计并实现一套基于SpringBootVue的物品租赁管理系统,解决当前物品租赁行业中租赁流程繁琐、库存管控低效、订单跟踪不便、押金与归还管理混乱等问题,适配个人及中小型租赁企业的信息化管理需求。系统采用前后端分离架构,…

作者头像 李华
网站建设 2026/3/12 19:48:48

什么是向量单位化 (vector normalization)

想象一下,向量就像一支箭头:它有方向(箭头指向哪里),也有长度(箭头有多长)。比如在2D平面里,一个向量可以表示“向右走3步,再向上走4步”,写成 (3, 4)。这支箭…

作者头像 李华