全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

pytorch

ABPN人像美肤

基于混合图层的高清人像美肤模型论文｜ github 人像美肤模型可用于对图像中的人体皮肤进行处理，实现匀肤（处理痘印、肤色不均等）、去瑕疵（脂肪粒、斑点、痣等）以及美白等功能。模型仅对裸露的皮肤进

730pytorchcv

StructBERT零样本分类-中文-base

StructBERT零样本分类模型介绍模型详细介绍及实现原理可参考评测文章：世界那么大，我想去看看——探索ModelScope之零样本分类 Yin等人[1]提出了一种使用预训练的自然语言推理模型来实

1330pytorchnlp

GPEN人像修复增强

人像修复介绍输入一张包含人像的图像，算法会对图像中的每一个检测到的人像做修复和增强，对图像中的非人像区域采用RealESRNet做两倍的超分辨率，最终返回修复后的完整图像。模型描述 GPEN将预训

890pytorchcv

人体检测-通用-Base

resnet18-human-detection模型介绍给定一张输入图像，输出图像中人体的坐标。期望模型使用方式与适用范围本模型适用范围较广，覆盖室内外、监控、单人多人等大部分场景。如何使用

630pytorchcv

UniASR语音识别-中文方言-通用-16k-离线

Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能，可直接对时长为数小时音频进行识别，并输出带标点文字与时间戳： ASR模型：Paraformer-

2730pytorchaudio

读光-文字识别-行识别模型-中英-文档印刷体文本领域

读光文字识别 News 2023年6月：新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月：新增训练/微调时读取本地数据集的lmdb，用训练/

710pytorchcv

语音合成-美式英文-通用领域-16k-发音人Annie

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

690pytorchaudio

HRNet人体关键点-2D

15点人体关键点检测模型输入一张人物图像，实现端到端的人体关键点检测，输出图像中所有人体的15点人体关键点坐标、点位置信度和人体检测框，点位顺序如下图所示。 15点人体关键点模型描述该任务采用

980pytorchcv

实时香烟检测-通用

实时香烟检测-通用模型介绍本模型为高性能热门应用系列检测模型中的实时香烟检测模型，基于面向工业落地的高性能检测框架DAMOYOLO，其精度和速度超越当前经典的YOLO系列方法。用户使用的时候，

430pytorchcv

通义千问-VL-Chat

Qwen-VL ? ? ｜ Qwen-VL-Chat ? ? (Int4: ? ? ) ｜ Qwen-VL-Plus ? ? ｜

1380pytorch

UniASR语音识别-粤语简体-通用-16k-离线

Highlights UniASR粤语简体语音识别模型，可对近场、低噪、正常语速、朗读形式的粤语简体音频进行语音识别： ASR模型：UniASR模型，粤语简体语音识别模型。 ITN模型：粤语简体IT

1410pytorchaudio

StructBERT FAQ问答-中文-通用领域-base

FAQ问答任务介绍 FAQ问答是智能对话系统(特别是垂直领域对话系统)的核心业务场景，业务专家基于经验或数据挖掘的结果，将用户会频繁问到的业务知识以Q&A的形式维护起来，称之为知识库，当用户使用对话

500pytorchnlp

GPEN人像增强修复-大分辨率人脸

570pytorchcv

StructBERT文本相似度-中文-通用-base

StructBERT中文文本相似度模型介绍 StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上，用atec、bqcorpus、chineseST

590pytorchnlp

StructBERT情感分类-中文-通用-base

StructBERT中文情感分类模型介绍情感分类任务，通常为输入一段句子或一段话，返回该段话正向/负向的情感极性，在用户评价，观点抽取，意图识别中往往起到重要作用。StructBERT中文情感分类模

680pytorchnlp

图像质量MOS评估

Image Quality Assessment for UGC 模型描述基于resnet的一个简单基线，可以有效评估图像的无参考画质，达到SOTA性能。其网络结构如下图所示： i

530pytorchcv

OFA图像描述-英文-通用领域-large

News 2023年1月: 优化了finetune流程，支持参数更新、自定义数据及脚本分布式训练等，见finetune示例。 2022年12月: 支持了batch inference，具体见本页快速

1130pytorchmulti-modal

语音合成-美式英文-通用领域-16k-发音人Andy

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

660pytorchaudio

FRCRN语音降噪-单麦-16k

FRCRN语音降噪模型介绍我们日常可能会碰到一些录音质量不佳的场景。比如，想录制一段干净的语音却发现周围都很吵，录制的语音里往往混杂着噪声。当我们在噪杂的地铁或者巴士上通电话，为了让对方听清楚，不得

1260pytorchaudio

Paraformer语音识别-中文-通用-16k-离线

Paraformer-large模型介绍 Highlights 热词版本：Paraformer-large热词版模型支持热词定制功能，基于提供的热词列表进行激励增强，提升热词的召回率和准确率。长音

710pytorchaudio

当前共5187个项目

1 2 3 4 5 6 7 8 9 10 ...

登录后即可上传、下载作品

搜索

分类

Mysql ios Kotlin 前端视频(Video)微信开发/微信公众号开发 Unity Web应用开发影视 SpringCloud

pytorch

重点城市程序员兼职推荐

重点岗位程序员兼职推荐