VideoCrafter 视频生成和编辑工具箱_开源项目-程序员客栈

VideoCrafter是一个用于制作视频内容的开源视频生成和编辑工具箱。

目前包括以下三种型号：

BaseT2V：通用文本到视频生成

提供基于潜在视频扩散模型(LVDM)的基本文本到视频(T2V)生成模型，可以根据输入的文本描述合成逼真的视频。

"Campfireatnightinasnowyforestwithstarryskyinthebackground."“晚上在白雪皑皑的森林里篝火晚会，背景是星空。”

"Carsrunningonthehighwayatnight."“晚上在高速公路上行驶的汽车。”

VideoLoRA：使用LoRA生成个性化文本到视频

基于预训练的LVDM，可以通过在一组描述特定概念的视频剪辑或图像上对其进行微调，来创建自己的视频生成模型。

以下是VideoLoRA模型的生成结果，这些模型在四种不同风格的视频剪辑上进行了训练。

通过提供描述视频内容的句子以及LoRA触发词（在LoRA训练期间指定），它可以生成具有所需风格（或主题/概念）的视频。

将 Amonkeyisplayingapiano,${trigger_word} 输入四个VideoLoRA模型的结果：

"LovingVincentstyle"

"frozenmoviestyle" “冰冻电影风格”

"MakotoShinkaiYourNamestyle" “新海诚你的名字风格”

"cocostyle" “可可风格”

VideoControl：具有更多条件控制的视频生成

通过在T2V模型上插入一个轻量级的适配器模块，可以获得具有更详细的控制信号（如深度）的生成结果。

inputtext: Ironmanisfightingagainsttheenemy,bigfireinthebackground,photorealistic,4k

VideoCrafter 视频生成和编辑工具箱开源项目