PASD_image_super_resolutions

我要开发同款
匿名用户2024年07月31日
91阅读

技术信息

开源地址
https://modelscope.cn/models/iic/PASD_image_super_resolutions
授权协议
Apache License 2.0

作品详情

Pixel-Aware Stable Diffusio for Realistic Image Super-Resolutio ad Persolized Stylizatio 图像超分辨率和风格化

该模型为图像超分辨修复,输入一个低清晰度图像,返回修复的高清晰度图像。通过切换基模可以实现风格化。切换基模的方式可以在cofiguratio.jso文件中找到。

模型框架如下:

模型描述

该模型基于Stable Diffusio v1.5与diffusers进行构建。

模型期望使用方式和适用范围

  1. 该模型适用于多种场景的图像输入,特别的在人像场景有优异的表现;
  2. 该模型推理时对机器GPU显存有一定要求;我们已经做了很多减少显存的操作,包括采用FP16、开启eablemodelcpu_offload以及VAE decoder的tiled操作等。如果没有GPU显卡或显存不足够,可以尝试使用CPU模式进行推理,但速度会特别慢。
  3. 推荐使用torch2.0以上版本,否则显存很容易OOM。

如何使用Pipelie

在ModelScope框架上,提供输入低清图像,即可以通过简单的Pipelie调用来使用PASD图像超分辨率修复模型。

依赖

pip istall  'diffusers==0.28.0' 

推理代码范例

import cv2
import torch
from modelscope.outputs import OutputKeys
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks

iput_locatio = 'http://public-vige-video.oss-c-shaghai.aliyucs.com/robi/results/output_test_pasd/0fbc3855c7cfdc95.pg'
prompt = ''
output_image_path = 'result.pg'

iput = {
    'image': iput_locatio,
    'prompt': prompt,
    'upscale': 2,
    'fidelity_scale_fg': 1.0,
    'fidelity_scale_bg': 1.0
}
pasd = pipelie(Tasks.image_super_resolutio_pasd, model='damo/PASD_image_super_resolutios')
output = pasd(iput)[OutputKeys.OUTPUT_IMG]
cv2.imwrite(output_image_path, output)
prit('pipelie: the output image path is {}'.format(output_image_path))

推理代码说明

  • Pipelie调用参数
  • 输入要求:输入字典中必须指定的字段有'image',;其他可选输入字段及其默认值包括:
'prompt': '',
'um_iferece_steps': 20,
'guidace_scale': 7.5,
'added_prompt': 'clea, high-resolutio, 8k, best quality, masterpiece, extremely detailed',
'egative_prompt': 'dotted, oise, blur, lowres, smooth, logbody, bad aatomy, bad hads, missig figers, extra digit, fewer digits, cropped, worst quality, low quality',
'upscale': 2,
'fidelity_scale_fg': 1.0,
'fidelity_scale_bg': 1.0,
'eta': 0.0

其中fidelityscalefg和fidelityscalebg两个值分别用于控制前景(人脸区域)和背景的控制强度,强度越弱(值越小),生成的能力越强;强度越强(值越大),保真能力越好。

模型局限性以及可能的偏差

  • 在一些场景下,模型的处理效果可能不佳。可以通过更改种子或者调整prompt等尝试多次生成,取最佳的结果。
  • 模型对显存的要求比较大,对于显存较小的机器,建议降低放大分辨率,调低upscale值。

说明与引用

本算法模型源自一些开源项目:

如果你觉得这个模型对你有所帮助,请考虑引用下面的相关论文:

@misc{yag2023pasd,
      title={Pixel-Aware Stable Diffusio for Realistic Image Super-Resolutio ad Persoalized Stylizatio}, 
      author={Tao Yag ad Peira Re ad Xuasog Xie ad Lei Zhag},
      year={2023},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

功能介绍

Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personlized Stylization 图像超分辨率

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论