Image caption任务是多模态领域任务,可以使用CNN与RNN相结合,最终网络模型能学习到图片与文字之间的关联,能够实现较好的语义表达和图片理解。最终效果是AI模型能够根据图片从词库抽取正确词语进行排序。代码使用tensorflow、pytorch、numpy等库实现。整个项目由我个人负责,包括:模型设计,数据集清洗,模型微调以及最终测试。
评论