pytorch

卡证检测矫正模型介绍 模型描述 在实人认证、文档电子化等场景中需要自动化提取卡证的信息,以便进一步做录入处理。这类场景通常存在两类问题,一是识别卡证类型时易受背景干扰,二是卡证拍摄角度造成的文字畸变影
240pytorchcv
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
190pytorchaudio
ROM语义相关性-中文-通用领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效果有
290pytorchnlp
u2net-salient-detection模型介绍 给定一张输入图像,输出视觉显著注意力图。 期望模型使用方式与适用范围 本模型适用范围较广,预测像素视觉显著注意程度,但不涉及图像中的语义信息。
200pytorchcv
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
230pytorchaudio
MTCNN 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸检测与五官定位。 人脸检测关键点模型MTCNN 模型描述 MTCNN是工业界广泛应用的检测关键点二合一模型, (论文地址,
200pytorchcv
BaSSL视频场景分割模型介绍 视频场景分割任务:场景(scene)定义为一段在语义上具有连续性的视频片段,视频场景分割指的是将一段视频分成若干个场景。 本模型使用基于ResNet-50的结构
180pytorchcv
coROM中文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大
340pytorchnlp
RANER介绍 What's New 2023年8月: 开放域文本理解大模型 已上线,无需训练,即可完成实体识别、文本分类、阅读理解等多种任务! 2023年4月: - 如您需要自定义实体类型,请尝试
190pytorchnlp
LaMa image inpainting 图像填充介绍 本模型选自LaMa算法,同时支持高分辨率图像(~2k)在线refinement,对图片进行修复,填充和编辑等。 模型描述 LaMa 采用F
260pytorchcv
swinL-image-panoptic-segmentation模型介绍 给定一张输入图像,输出全景分割掩膜,类别,分数(虚拟分数)。 全景分割是要分割出图像中的stuff,things。stuff
240pytorchcv
RANER介绍 What's New 2023年8月: 开放域文本理解大模型 已上线,无需训练,即可完成实体识别、文本分类、阅读理解等多种任务! 2023年4月: - 如您需要自定义实体类型,请尝试
270pytorchnlp
RANER介绍 What's New 2023年8月: 开放域文本理解大模型 已上线,无需训练,即可完成实体识别、文本分类、阅读理解等多种任务! 2022年12月: 训练所使用的序列理解统一框架Ad
310pytorchnlp
中文CLIP News 2022年11月: 发布ModelScope 1.0版本,以下能力请使用1.0.2及以上版本。 上线Huge模型(224分辨率) 上线创空间,更强大的demo展示:中文图文检
330pytorchmulti-modal
FairFace 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸属性识别、表情识别。 人脸属性模型FairFace 模型描述 FairFace是结构简单性能不错的人脸属性模型(代码地
260pytorchcv
RetinaFace 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸检测与五官定位。 人脸检测关键点模型RetinaFace 模型描述 RetinaFace为当前学术界和工业界精度较
250pytorchcv
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
190pytorchaudio
基于序列建模的文本分割模型 该模型基于wiki-zh公开语料训练,对未分割的长文本进行段落分割。提升未分割文本的可读性以及下游NLP任务的性能。 模型描述 随着在线教学、会议等技术的扩展,口语文档的数
230pytorchnlp
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
200pytorchaudio
读光文字识别 News 2023年6月: 新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月: 新增训练/微调时读取本地数据集的lmdb,用训练/
230pytorchcv
当前共5187个项目
×
寻找源码
源码描述
联系方式
提交