VideoCrafter是一个用于制作视频内容的开源视频生成和编辑工具箱。
目前包括以下三种型号:
BaseT2V:通用文本到视频生成提供基于潜在视频扩散模型(LVDM)的基本文本到视频(T2V)生成模型,可以根据输入的文本描述合成逼真的视频。
"Campfireatnightinasnowyforestwithstarryskyinthebackground."“晚上在白雪皑皑的森林里篝火晚会,背景是星空。”
"Carsrunningonthehighwayatnight."“晚上在高速公路上行驶的汽车。”
VideoLoRA:使用LoRA生成个性化文本到视频基于预训练的LVDM,可以通过在一组描述特定概念的视频剪辑或图像上对其进行微调,来创建自己的视频生成模型。
以下是VideoLoRA模型的生成结果,这些模型在四种不同风格的视频剪辑上进行了训练。
通过提供描述视频内容的句子以及LoRA触发词(在LoRA训练期间指定),它可以生成具有所需风格(或主题/概念)的视频。
将 Amonkeyisplayingapiano,${trigger_word} 输入四个VideoLoRA模型的结果:
"LovingVincentstyle"
"frozenmoviestyle" “冰冻电影风格”
"MakotoShinkaiYourNamestyle" “新海诚你的名字风格”
"cocostyle" “可可风格”
VideoControl:具有更多条件控制的视频生成通过在T2V模型上插入一个轻量级的适配器模块,可以获得具有更详细的控制信号(如深度)的生成结果。
inputtext: Ironmanisfightingagainsttheenemy,bigfireinthebackground,photorealistic,4k
评论