视频批量制作后端

我要开发同款
李亦博2024年08月04日
54阅读

作品详情

1. 使用stable-diffusion本地部署AI绘画,中文prompt自动翻译,自定义lora训练,图片识别prompt实现图像重绘,在此基础上api接口调用提供多种不同风格模型,PuLID明星艺术照生成。
2. 使用ffmpeg,视频片段混剪与拼接,添加文字、图片、视频、GIF贴纸,音频混音合并,转场特效,画面特效,音效,字幕,抽帧,随机片段变声,批量制作视频,自动剪辑,在抖音搬运领域可使用较为简单的操作方法,生成千万条视频,轻松过原创。
3. 使用GPT-sovits制作文本转语音,语音合成服务,应用于视频剪辑。
4. 使用LLama大语言模型进行翻译,根据小说内容生成SD图像prompt,在低端显卡下使用LLama-cpp运行7B模型。
5. 视频/音频,支持mp4/wav/mp3等格式,识别语音并转换成srt字幕文件,可用于再次配音。
6. 图像超分,将AI绘画的图片进行超分辨率,优点在于,由于直接画高分辨率图像显存消耗和时间消耗都较长,画较低分辨率图像整体画面无杂物的情况下,提高图像清晰度。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论