复现text2image的模型(VQGAN+CLIP)

我要开发同款
proginn21082387652024年03月31日
82阅读
开发技术自然语言处理、算法设计、深度学习

作品详情

项目背景与目标
AliceMind-PALM模型不支持图片生成任务。需要参考现有图片生成模型如DALLE,为PALM补充下游图片生成的代码;
调研并实现图片生成代码的训练和推理;
待解决的问题
缺少算力提供
独立完成调研与代码调试
主要工作
调研大量文字到图片模型,最终找到VQGAN+CLIP
完成代码的调试,将PALM生成的文字接入到搭建好的模型
commit代码到主仓库,2k Star
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论