VideoCrafter 视频生成和编辑工具箱开源项目

我要开发同款
匿名用户2023年04月10日
75阅读
开发技术Python
所属分类人工智能、计算机视觉库/人脸识别
授权协议未知

作品详情

VideoCrafter是一个用于制作视频内容的开源视频生成和编辑工具箱。

目前包括以下三种型号:

BaseT2V:通用文本到视频生成

提供基于潜在视频扩散模型(LVDM)的基本文本到视频(T2V)生成模型,可以根据输入的文本描述合成逼真的视频。

"Campfireatnightinasnowyforestwithstarryskyinthebackground."“晚上在白雪皑皑的森林里篝火晚会,背景是星空。”

"Carsrunningonthehighwayatnight."“晚上在高速公路上行驶的汽车。”

VideoLoRA:使用LoRA生成个性化文本到视频

基于预训练的LVDM,可以通过在一组描述特定概念的视频剪辑或图像上对其进行微调,来创建自己的视频生成模型。

以下是VideoLoRA模型的生成结果,这些模型在四种不同风格的视频剪辑上进行了训练。

通过提供描述视频内容的句子以及LoRA触发词(在LoRA训练期间指定),它可以生成具有所需风格(或主题/概念)的视频。

将 Amonkeyisplayingapiano,${trigger_word} 输入四个VideoLoRA模型的结果:

"LovingVincentstyle" 

"frozenmoviestyle" “冰冻电影风格”

"MakotoShinkaiYourNamestyle" “新海诚你的名字风格”

"cocostyle" “可可风格”

VideoControl:具有更多条件控制的视频生成

通过在T2V模型上插入一个轻量级的适配器模块,可以获得具有更详细的控制信号(如深度)的生成结果。

inputtext: Ironmanisfightingagainsttheenemy,bigfireinthebackground,photorealistic,4k

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论