Portrait+ 本模型利用dreambooth方法微调Stable Diffusion 1.5而来,数据集为中近距离的人像照片。 在prompt中加入portrait+ style以实现该效果(
220pytorchtext2image generation
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Paraformer-
390pytorchaudio
CoROM语义相关性-英文-通用领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效
280pytorchnlp
Analog Diffusion 本模型利用dreambooth方法微调Stable Diffusion 1.5而来,数据集为胶片摄影数据集。 在prompt中加入analog style 以实现胶
220pytorchtext2image generation
AdaInt: Learning Adaptive Intervals for 3D Lookup Tables on Real-time Image Enhancement 模型描述 该模型为图像色
210pytorchcv
图像去色带介绍 输入由于色彩精度不够存在色带的图片,返回去除色带后的图片。模型使用RealESRAGN网络结构进行训练,能实现较好的去除色带效果。 模型描述 在Debanding数据集的基础之上,采用
350pytorchcv
视频全景分割 给定一个输入视频,输出视频每一帧的全景分割掩膜,类别,分数(虚拟分数),矩形框和跟踪的id。 与图像全景分割不同之处在于视频全景分割能够得到每个物体跟踪的id。 全景分割是要分割出图像中
310pytorchcv
>>返回卡通化系列模型专题页 卡通系列文生图模型-扁平风 输入一段文本提示词,实现特定风格卡通图像生成,返回符合文本描述的扁平风格结果图像。 其生成效果如下所示: (1) 人物生成 (2) 物体场景
400pytorchcv
>>返回卡通化系列模型专题页 卡通系列文生图模型-水彩风 输入一段文本提示词,实现特定风格卡通图像生成,返回符合文本描述的水彩风格结果图像。 其生成效果如下所示: (1) 人物生成 (2) 物体场景
280pytorchcv
>>返回卡通化系列模型专题页 卡通系列文生图模型-漫画风 输入一段文本提示词,实现特定风格卡通图像生成,返回符合文本描述的漫画风格结果图像。 其生成效果如下所示: (1) 人物生成 (2) 物体场景
290pytorchcv
17点人体关键点检测模型 输入一段包含人物的视频,实现端到端的人体关键点检测,输出视频中每一帧图像人体的17点人体3D关键点坐标。 3D人体关键点系列模型 HDFormer Cann
300pytorchcv
基于视觉和语言的知识蒸馏的开放词汇目标检测模型介绍 模型描述 利用视觉和语言的知识蒸馏提取来学习开放词汇目标检测,提出了一种从开放词汇图像分类模型中知识蒸馏的开放词汇检测方法ViLD,ViLD是第一个
390tensorflowcv
Redshift Diffusion 本模型自 Stable Diffusion 在高分辨率3D艺术图像数据集上微调而来。在 prompt 中加入 redshift style 可以在生成图像中实现该
350pytorchtext2image generation
DEPE模型介绍 基于多摄像头的纯视觉3D目标检测方法在自动驾驶领域得到越来越广泛的关注。DEPE模型采用Transformer的end-to-end的结构设计,无需传统检测方法中手工设计的要素(如a
330pytorchcv
算法介绍 任务简介 单目深度估计,是指以单目RGB图像作为输入,根据图像中的结构信息、角点信息、相对位置信息等等对输入中的每个像素的深度值进行估计,输出稠密深度图。 模型介绍 本模型来自于From B
280pytorchcv
模型描述 2020 年 4 月,YOLOv4 在悄无声息中重磅发布,在目标检测领域引起广泛的讨论。在 YOLO 系列的原作者 Joseph Redmon 宣布退出 CV 领域后,表明官方不再更新 YO
230pytorchcv
运动生成模型介绍 根据文本描述,自动生成人体的运动对很多行业都有重要的应用,例如动画制作,元宇宙以及机器人等。上图展示了模型的输入和输出效果 模型描述 整个任务根据文字描述生成对应人体的运动,
210pytorchcv
DDPM-Seg模型介绍 本模型使用预训练好的[guided diffusion]()作为特征提取器,并在有标注的训练数据很少的情况下取得了SOTA的结果。 本模型的生成效果如下所示: 模型描述 本模
390pytorchcv
FRFM模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸比对1:1、口罩人脸比对1:1、人脸搜索1:N、公众人物识别、明星识别。 口罩人脸识别模型FRFM。 模型描述 口罩人脸识别模型
310pytorchcv
模型描述 少样本目标检测模型DeFRCN,提出了一种简单而有效的基于Decoupled Faster R-CNN,引入新的GDL和PCB,显著地缓解了传统Faster R-CNN在数据匮乏场景下的潜在
350pytorchcv
当前共161563个项目
×
寻找源码
源码描述
联系方式
提交