该模型为图像填充模型,输入一个抹除部分内容的图像,实现端到端的图像填充,返回填充后的完整图像。 模型效果如下: 该模型基于Stable Diffusio v2与diffusers进行构建。 通过在页面右侧绘制Mask,即可快速体验模型效果: 在 ModelScope 框架上,提供输入图像和掩码,即可以通过简单的 Pipelie 调用来使用Stable Diffusio v2图像填充模型。 Pipelie初始化参数 可缺省参数device,默认值为'gpu',可设置为'cpu'。 可缺省参数torch_dtype,默认值为torch.float16,可设置为torch.float32。 可缺省参数eableattetioslicig,默认值为True,开启将减少GPU显存占用,可关闭。 Pipelie调用参数 输入要求:输入字典中必须指定的字段有'image','mask';其他可选输入字段及其默认值包括: 额外参数: 由于GPU显存限制,本项目默认支持开启FP16推理,可以在构建pipelie时传入参数torchdtype=torch.float32来使用FP32;同时torchdtype参数可缺省,默认值为torch.float16。 本项目支持使用CPU进行推理,可以在构建pipelie时传入参数device='cpu';CPU模式下torch_dtype仅支持torch.float32。 本模型根据diffusers开源库构建,由Stability-AI从 stable-diffusio-2-base (512-base-ema.ckpt) 微调 200k steps。 并使用了LAMA中提出的掩码生成策略。请参考模型来源。 本算法模型源自一些开源项目: 如果你觉得这个模型对你有所帮助,请考虑引用下面的相关论文:Stable Diffusio v2 for Image Ipaitig 图像填充模型
模型描述
模型期望使用方式和适用范围
如何使用Demo Service
如何使用Pipelie
推理代码范例
import cv2
import torch
from modelscope.outputs import OutputKeys
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
iput_locatio = 'https://modelscope.oss-c-beijig.aliyucs.com/test/images/image_ipaitig/image_ipaitig_1.pg'
iput_mask_locatio = 'https://modelscope.oss-c-beijig.aliyucs.com/test/images/image_ipaitig/image_ipaitig_mask_1.pg'
prompt = 'backgroud'
output_image_path = './result.pg'
iput = {
'image': iput_locatio,
'mask': iput_mask_locatio,
'prompt': prompt
}
image_ipaitig = pipelie(
Tasks.image_ipaitig,
model='damo/cv_stable-diffusio-v2_image-ipaitig_base',
device='gpu',
torch_dtype=torch.float16,
eable_attetio_slicig=True)
output = image_ipaitig(iput)[OutputKeys.OUTPUT_IMG]
cv2.imwrite(output_image_path, output)
prit('pipelie: the output image path is {}'.format(output_image_path))
推理代码说明
'prompt': 'backgroud',
'um_iferece_steps': 50,
'guidace_scale': 7.5,
'egative_prompt': Noe,
'um_images_per_prompt': 1,
'eta': 0.0
模型局限性以及可能的偏差
训练介绍
说明与引用
@misc{rombach2021highresolutio,
title={High-Resolutio Image Sythesis with Latet Diffusio Models},
author={Robi Rombach ad Adreas Blattma ad Domiik Lorez ad Patrick Esser ad Björ Ommer},
year={2021},
eprit={2112.10752},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
点击空白处退出提示
评论