全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

pytorch

RetinaFace人脸检测关键点模型

RetinaFace 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸检测与五官定位。人脸检测关键点模型RetinaFace 模型描述 RetinaFace为当前学术界和工业界精度较

740pytorchcv

卡证检测矫正模型

卡证检测矫正模型介绍模型描述在实人认证、文档电子化等场景中需要自动化提取卡证的信息，以便进一步做录入处理。这类场景通常存在两类问题，一是识别卡证类型时易受背景干扰，二是卡证拍摄角度造成的文字畸变影

710pytorchcv

LaMa图像填充

LaMa image inpainting 图像填充介绍本模型选自LaMa算法，同时支持高分辨率图像(~2k)在线refinement，对图片进行修复，填充和编辑等。模型描述 LaMa 采用F

770pytorchcv

Mask2Former-SwinL全景分割

swinL-image-panoptic-segmentation模型介绍给定一张输入图像，输出全景分割掩膜，类别，分数（虚拟分数）。全景分割是要分割出图像中的stuff，things。stuff

540pytorchcv

人脸属性识别模型FairFace

FairFace 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸属性识别、表情识别。人脸属性模型FairFace 模型描述 FairFace是结构简单性能不错的人脸属性模型（代码地

760pytorchcv

U2Net图像显著性检测

u2net-salient-detection模型介绍给定一张输入图像，输出视觉显著注意力图。期望模型使用方式与适用范围本模型适用范围较广，预测像素视觉显著注意程度，但不涉及图像中的语义信息。

740pytorchcv

RaNER命名实体识别-中文-电商领域-细粒度-base

RANER介绍 What's New 2023年8月：开放域文本理解大模型已上线，无需训练，即可完成实体识别、文本分类、阅读理解等多种任务！ 2023年4月： - 如您需要自定义实体类型，请尝试

1680pytorchnlp

语音合成-英式英文-通用领域-16k-发音人Luca

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

610pytorchaudio

CLIP模型-中文-通用领域-large-336分辨率

中文CLIP News 2022年11月：发布ModelScope 1.0版本，以下能力请使用1.0.2及以上版本。上线Huge模型(224分辨率) 上线创空间，更强大的demo展示：中文图文检

870pytorchmulti-modal

Mtcnn人脸检测关键点模型

MTCNN 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸检测与五官定位。人脸检测关键点模型MTCNN 模型描述 MTCNN是工业界广泛应用的检测关键点二合一模型, (论文地址,

570pytorchcv

CoROM文本向量-中文-通用领域-base

coROM中文通用文本表示模型文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展，尤其是预训练语言模型的出现极大

780pytorchnlp

UniASR语音识别-日语-通用-16k-离线

UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调，研究人员和开发人员可以更方便地进行语音识别模型

710pytorchaudio

语音合成-英式英文-通用领域-16k-发音人Luna

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

750pytorchaudio

RaNER命名实体识别-中文-新闻领域-base

620pytorchnlp

读光-文字识别-行识别模型-中英-通用领域

读光文字识别 News 2023年6月：新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月：新增训练/微调时读取本地数据集的lmdb，用训练/

980pytorchcv

语音合成-中文-多情感领域-16k-多发音人

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

1050pytorchaudio

BaSSL视频场景分割-长视频领域

BaSSL视频场景分割模型介绍视频场景分割任务：场景（scene）定义为一段在语义上具有连续性的视频片段，视频场景分割指的是将一段视频分成若干个场景。本模型使用基于ResNet-50的结构

720pytorchcv

ROM语义相关性-中文-通用领域-base

ROM语义相关性-中文-通用领域模型介绍文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。近几年, BERT等大规模预训练语言模型的出现使得文本表示效果有

890pytorchnlp

BERT文本分割-中文-通用领域

基于序列建模的文本分割模型该模型基于wiki-zh公开语料训练，对未分割的长文本进行段落分割。提升未分割文本的可读性以及下游NLP任务的性能。模型描述随着在线教学、会议等技术的扩展，口语文档的数

720pytorchnlp

RaNER命名实体识别-中文-电商领域-base

RANER介绍 What's New 2023年8月：开放域文本理解大模型已上线，无需训练，即可完成实体识别、文本分类、阅读理解等多种任务！ 2022年12月：训练所使用的序列理解统一框架Ad

760pytorchnlp

当前共5187个项目

1 2 3 4 5 6 7 8 9 10 ...

登录后即可上传、下载作品

搜索

分类

Mysql ios Kotlin 前端视频(Video)微信开发/微信公众号开发 Unity Web应用开发影视 SpringCloud

pytorch

重点城市程序员兼职推荐

重点岗位程序员兼职推荐