图像超分辨率介绍
输入低分辨率图片,返回4倍超分辨率后的高清晰图片。模型基于RealESRAGN中的降质方式进行训练,在复杂真实降质图片上也有较好的表现。
模型描述
RealESRGAN提出了通过多次降质的方式来模拟真实复杂降质,相比较于之前的简单下采样,能够更好处理真实的低分辨率场景。
数据降质方式
采用high order degradation的方式,具体流程如下:
模型结构
采用ESRGAN的基本结构,针对不同超分倍数的输入特别处理,具体如下:
期望模型使用方式以及适用范围
本模型适用范围较广,给定任意的低分辨率图片,都能生成一张4倍超分辨率后的高清晰度图片。
如何使用
在ModelScope框架上,提供低分辨图片,即可以通过简单的Pipeline调用来使用图像超分辨率模型。
代码范例
import cv2
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
sr = pipeline('image-super-resolution-x2', model='bubbliiiing/cv_rrdb_image-super-resolution-x2')
result = sr('https://modelscope.oss-cn-beijing.aliyuncs.com/test/images/dogs.jpg')
cv2.imwrite('result.png', result[OutputKeys.OUTPUT_IMG])
模型局限性以及可能的偏差
通过多次降质的方式虽然能更好的模拟真实降质数据,但是并不能完全消除模拟数据与真实数据之间的domain gap,因此存在修复产生瑕疵的场景。同时,模型文件较大,输入图片的分辨率不宜过大,否则容易出现OOM错误。
训练数据介绍
训练数据为DIV2K, Flicker2K, FFHQ等公开数据集。
相关论文以及引用信息
@inproceedings{liang2022LDL,
author = {Liang, Jie and Zeng, Hui and Zhang, Lei},
title = {Details or Artifacts: A Locally Discriminative Learning Approach to Realistic Image Super-Resolution},
booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
date = {2022}
}
@inproceedings{wang2021realesrgan,
author = {Xintao Wang and Liangbin Xie and Chao Dong and Ying Shan},
title = {Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data},
booktitle = {International Conference on Computer Vision Workshops (ICCVW)},
date = {2021}
}
评论