软件平台系统开发_APP网站小程序开发-程序员客栈

全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

人像生成模型plus

Portrait+ 本模型利用dreambooth方法微调Stable Diffusion 1.5而来，数据集为中近距离的人像照片。在prompt中加入portrait+ style以实现该效果（

220pytorchtext2image generation

UniASR语音识别-波斯语-通用-16k

Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能，可直接对时长为数小时音频进行识别，并输出带标点文字与时间戳： ASR模型：Paraformer-

390pytorchaudio

CoROM语义相关性-英文-通用领域-tiny

CoROM语义相关性-英文-通用领域模型介绍文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。近几年, BERT等大规模预训练语言模型的出现使得文本表示效

280pytorchnlp

胶片质感扩散生成模型

Analog Diffusion 本模型利用dreambooth方法微调Stable Diffusion 1.5而来，数据集为胶片摄影数据集。在prompt中加入analog style 以实现胶

220pytorchtext2image generation

Adaptive-Interval-3DLUT图像调色

AdaInt: Learning Adaptive Intervals for 3D Lookup Tables on Real-time Image Enhancement 模型描述该模型为图像色

210pytorchcv

RealESRGAN图像去色带

图像去色带介绍输入由于色彩精度不够存在色带的图片，返回去除色带后的图片。模型使用RealESRAGN网络结构进行训练，能实现较好的去除色带效果。模型描述在Debanding数据集的基础之上，采用

350pytorchcv

视频全景分割-VideoKNet-SwinB

视频全景分割给定一个输入视频，输出视频每一帧的全景分割掩膜，类别，分数（虚拟分数），矩形框和跟踪的id。与图像全景分割不同之处在于视频全景分割能够得到每个物体跟踪的id。全景分割是要分割出图像中

310pytorchcv

卡通系列文生图模型-扁平风

>>返回卡通化系列模型专题页卡通系列文生图模型-扁平风输入一段文本提示词，实现特定风格卡通图像生成，返回符合文本描述的扁平风格结果图像。其生成效果如下所示： (1) 人物生成 (2) 物体场景

400pytorchcv

卡通系列文生图模型-水彩风

>>返回卡通化系列模型专题页卡通系列文生图模型-水彩风输入一段文本提示词，实现特定风格卡通图像生成，返回符合文本描述的水彩风格结果图像。其生成效果如下所示： (1) 人物生成 (2) 物体场景

280pytorchcv

卡通系列文生图模型-漫画风

>>返回卡通化系列模型专题页卡通系列文生图模型-漫画风输入一段文本提示词，实现特定风格卡通图像生成，返回符合文本描述的漫画风格结果图像。其生成效果如下所示： (1) 人物生成 (2) 物体场景

290pytorchcv

HDFormer人体关键点-通用领域-3D

17点人体关键点检测模型输入一段包含人物的视频，实现端到端的人体关键点检测，输出视频中每一帧图像人体的17点人体3D关键点坐标。 3D人体关键点系列模型 HDFormer Cann

300pytorchcv

基于视觉和语言的知识蒸馏的开放词汇目标检测

基于视觉和语言的知识蒸馏的开放词汇目标检测模型介绍模型描述利用视觉和语言的知识蒸馏提取来学习开放词汇目标检测，提出了一种从开放词汇图像分类模型中知识蒸馏的开放词汇检测方法ViLD，ViLD是第一个

390tensorflowcv

Redshift渲染器风格-扩散生成模型

Redshift Diffusion 本模型自 Stable Diffusion 在高分辨率3D艺术图像数据集上微调而来。在 prompt 中加入 redshift style 可以在生成图像中实现该

350pytorchtext2image generation

DEPE-3D目标检测-自动驾驶领域

DEPE模型介绍基于多摄像头的纯视觉3D目标检测方法在自动驾驶领域得到越来越广泛的关注。DEPE模型采用Transformer的end-to-end的结构设计，无需传统检测方法中手工设计的要素(如a

330pytorchcv

多尺度局部平面引导的单目深度估计

算法介绍任务简介单目深度估计，是指以单目RGB图像作为输入，根据图像中的结构信息、角点信息、相对位置信息等等对输入中的每个像素的深度值进行估计，输出稠密深度图。模型介绍本模型来自于From B

280pytorchcv

兰丁宫颈细胞AI辅助诊断模型

模型描述 2020 年 4 月，YOLOv4 在悄无声息中重磅发布，在目标检测领域引起广泛的讨论。在 YOLO 系列的原作者 Joseph Redmon 宣布退出 CV 领域后，表明官方不再更新 YO

230pytorchcv

运动生成-人体运动-英文

运动生成模型介绍根据文本描述，自动生成人体的运动对很多行业都有重要的应用，例如动画制作，元宇宙以及机器人等。上图展示了模型的输入和输出效果模型描述整个任务根据文字描述生成对应人体的运动,

210pytorchcv

DDPM-Seg基于扩散模型的语义分割

DDPM-Seg模型介绍本模型使用预训练好的[guided diffusion]()作为特征提取器，并在有标注的训练数据很少的情况下取得了SOTA的结果。本模型的生成效果如下所示：模型描述本模

390pytorchcv

口罩人脸识别模型FRFM-large

FRFM模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸比对1:1、口罩人脸比对1:1、人脸搜索1:N、公众人物识别、明星识别。口罩人脸识别模型FRFM。模型描述口罩人脸识别模型

310pytorchcv

defrcn少样本目标检测

模型描述少样本目标检测模型DeFRCN，提出了一种简单而有效的基于Decoupled Faster R-CNN，引入新的GDL和PCB，显著地缓解了传统Faster R-CNN在数据匮乏场景下的潜在

350pytorchcv

当前共161563个项目

...8070 8071 8072 8073 8074 8075 8076 8077 8078 8079

登录后即可上传、下载作品

搜索

分类

PaaS系统/容器 flutter 教程与指南文档/文本编辑 DBA ASP 服务器端JavaScript element-ui 数据库服务器网页开发工具

重点城市程序员兼职推荐

重点岗位程序员兼职推荐