300亿参数开源模型Step-Video-TI2V：让人人都能制作电影级动态视频-开发者社区

300亿参数开源模型Step-Video-TI2V：让人人都能制作电影级动态视频

【免费下载链接】stepvideo-ti2v项目地址: https://ai.gitcode.com/StepFun/stepvideo-ti2v

导语

中国AI公司阶跃星辰开源的300亿参数图生视频模型Step-Video-TI2V，以102帧超长序列、运动幅度与镜头轨迹双控技术，重新定义图像转视频技术边界，推动AIGC创作从"随机生成"迈向"精准可控"新纪元。

行业现状：快速增长的市场与技术瓶颈并存

2025年，AI视频生成技术迎来爆发式增长。根据Fortune Business Insights数据，2024年全球AI视频生成市场规模为6.15亿美元，预计2032年将达到25.63亿美元，2025至2032年复合增速维持20%。另据IDC最新报告显示，2025年上半年中国视频云市场规模达52.3亿美元，同比增长8.9%，其中音视频AI实时互动等领域增长显著，达4000万美元，AI应用已成为推动市场回暖的新动力。

然而，主流模型普遍面临三大痛点：动态连贯性不足（人物动作卡顿）、画面与原图脱节（角色面部特征失真）、创作自由度受限（无法控制镜头运动）。这些问题严重制约了AI视频生成技术在各行业的大规模应用。

核心亮点：重新定义图生视频的四大维度

1. 动态自由操控：告别"随机生成"

传统AI视频生成常面临"画面混乱"或"动态单一"的问题，而Step-Video-TI2V通过两大核心优化打破僵局：

运动幅度可控：用户可调节画面中元素的动态强度，从静态稳定到高动态场景无缝切换
镜头运镜可控：支持推拉摇移、升降等基础运镜，甚至能生成电影级复杂镜头效果

2. 天生"特效Buff"与多尺寸适配

模型内置特效生成能力，可自动添加动态光影、粒子效果等，尤其擅长动漫风格渲染。无论是二次元角色动捕，还是奇幻场景的粒子特效，都能一键实现。同时支持多尺寸适配，横屏、竖屏、方屏通吃，避免画面变形或黑边问题。

3. 技术架构创新：分布式推理优化

通过文本编码器、VAE解码和DiT的解耦策略，优化GPU资源利用率。根据官方测试数据，在4 GPU并行模式下，生成768px×768px×102帧视频仅需288秒，显存占用64.63GB，相比单GPU模式效率提升3.7倍。

以下是Step-Video-TI2V模型运行要求（批处理大小=1，无cfg蒸馏）生成视频的表格：

GPU	分辨率/帧数	峰值GPU内存	50步耗时
1	768px×768px×102f	76.42 GB	1061s
1	544px×992px×102f	75.49 GB	929s
4	768px×768px×102f	64.63 GB	288s
4	544px×992px×102f	64.34 GB	251s

4. 开源生态支持：二次开发友好

开发者可基于模型进行二次开发，拓展特效功能（如结合LoRA技术）。在权威评测VBench-I2V中，Step-Video-TI2V以State-of-the-Art（当前最优）成绩登顶榜首，综合性能超越同类开源模型。该模型已适配华为昇腾计算平台，并在魔乐社区（Modelers）上线，开发者可零门槛体验。

应用场景：从创作工具到生产力革命

Step-Video-TI2V已展现出广泛的行业适用性：

动画创作者：输入角色立绘，一键生成动态分镜，节省80%手绘成本
短视频博主：用一张自拍生成"运镜大片"，轻松打造个人IP视觉标签
广告营销：快速生成产品动态展示视频，替代传统3D建模的高昂成本
游戏开发者：为角色动作设计提供灵感，或生成宣传CG片段

中国软件评测中心副总工程师黄江平指出："阶跃星辰的Step-Video-TI2V支持镜头运动与特效控制，已用于影视制作与工业仿真。这种差异化竞争策略，使中国模型在全球市场中占据独特生态位。"

行业影响：开源模式重塑内容生产链

Step-Video-TI2V的开源发布恰逢AI视频生成商业化加速期。据相关数据显示，2025年国内已有超30%的MCN机构采用AI视频生成工具，其中开源方案占比达62%。某快消品牌案例显示，采用"AI生成+真人配音"模式使季度商业投放量提升300%，总成本下降45%。

开源模式正在推动创作权向中小企业转移。阶跃星辰通过连续开源Step系列模型（包括文生视频、语音模型），正在构建多模态AI的开放生态。开发者可基于它开发插件、工具链，甚至孵化新商业模式——有创业者通过提供定制化视频生成服务，3个月内实现17万元营收。

未来展望：从"工具"到"协作平台"

随着模型性能持续优化和硬件成本下降，AI视频生成技术将在2-3年内实现从"可选工具"到"必备基建"的转变。Step-Video-TI2V后续计划推出MoE（混合专家）架构版本，在保持推理成本不变的情况下提升30%生成质量，并优化ComfyUI插件进一步降低创作门槛。

对于企业而言，现在正是布局AI视频能力的关键窗口期。建议内容团队评估Step-Video-TI2V等开源方案，建立内部AIGC工作流；技术团队关注模型微调与垂直领域优化；决策者则需制定"AI+视频"战略，把握成本重构带来的商业机遇。

快速上手指南

官方提供两种体验方式：

本地部署

git clone https://gitcode.com/StepFun/stepvideo-ti2v conda create -n stepvideo python=3.10 conda activate stepvideo cd StepFun-stepvideo-ti2v pip install -e .

云端体验

通过魔乐社区或阶跃AI网页版直接调用API，无需本地部署

随着Step-Video-TI2V等开源模型的持续迭代，视频创作正从专业领域走向全民创作，一个"人人都是视频导演"的时代正在加速到来。

【免费下载链接】stepvideo-ti2v项目地址: https://ai.gitcode.com/StepFun/stepvideo-ti2v

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

300亿参数开源模型Step-Video-TI2V：让人人都能制作电影级动态视频