视频批量制作后端_系统开发案例-程序员客栈

1. 使用stable-diffusion本地部署AI绘画，中文prompt自动翻译，自定义lora训练，图片识别prompt实现图像重绘，在此基础上api接口调用提供多种不同风格模型，PuLID明星艺术照生成。2. 使用ffmpeg，视频片段混剪与拼接，添加文字、图片、视频、GIF贴纸，音频混音合并，转场特效，画面特效，音效，字幕，抽帧，随机片段变声，批量制作视频，自动剪辑，在抖音搬运领域可使用较为简单的操作方法，生成千万条视频，轻松过原创。3. 使用GPT-sovits制作文本转语音，语音合成服务，应用于视频剪辑。4. 使用LLama大语言模型进行翻译，根据小说内容生成SD图像prompt，在低端显卡下使用LLama-cpp运行7B模型。5. 视频/音频，支持mp4/wav/mp3等格式，识别语音并转换成srt字幕文件，可用于再次配音。6. 图像超分，将AI绘画的图片进行超分辨率，优点在于，由于直接画高分辨率图像显存消耗和时间消耗都较长，画较低分辨率图像整体画面无杂物的情况下，提高图像清晰度。

视频批量制作后端

作品详情

重点城市程序员兼职推荐

重点岗位程序员兼职推荐