pytorch

FRCRN语音降噪模型介绍 我们日常可能会碰到一些录音质量不佳的场景。比如,想录制一段干净的语音却发现周围都很吵,录制的语音里往往混杂着噪声。当我们在噪杂的地铁或者巴士上通电话,为了让对方听清楚,不得
220pytorchaudio
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
230pytorchaudio
Highlights UniASR粤语简体语音识别模型,可对近场、低噪、正常语速、朗读形式的粤语简体音频进行语音识别: ASR模型:UniASR模型,粤语简体语音识别模型。 ITN模型:粤语简体IT
260pytorchaudio
Qwen-VL ? ?  | Qwen-VL-Chat ? ?  (Int4: ? ? ) | Qwen-VL-Plus ? ?  |
310pytorch
StructBERT零样本分类模型介绍 模型详细介绍及实现原理可参考评测文章:世界那么大,我想去看看——探索ModelScope之零样本分类 Yin等人[1]提出了一种使用预训练的自然语言推理模型来实
240pytorchnlp
人像修复介绍 输入一张包含人像的图像,算法会对图像中的每一个检测到的人像做修复和增强,对图像中的非人像区域采用RealESRNet做两倍的超分辨率,最终返回修复后的完整图像。 模型描述 GPEN将预训
260pytorchcv
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
260pytorchaudio
实时香烟检测-通用 模型介绍 本模型为高性能热门应用系列检测模型中的 实时香烟检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。用户使用的时候,
170pytorchcv
Image Quality Assessment for UGC 模型描述 基于resnet的一个简单基线,可以有效评估图像的无参考画质,达到SOTA性能。其网络结构如下图所示: i
200pytorchcv
读光文字识别 News 2023年6月: 新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月: 新增训练/微调时读取本地数据集的lmdb,用训练/
200pytorchcv
News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年12月: 支持了batch inference,具体见本页快速
250pytorchmulti-modal
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Paraformer-
300pytorchaudio
FAQ问答任务介绍 FAQ问答是智能对话系统(特别是垂直领域对话系统)的核心业务场景,业务专家基于经验或数据挖掘的结果,将用户会频繁问到的业务知识以Q&A的形式维护起来,称之为知识库, 当用户使用对话
220pytorchnlp
Paraformer-large模型介绍 Highlights 热词版本:Paraformer-large热词版模型支持热词定制功能,基于提供的热词列表进行激励增强,提升热词的召回率和准确率。 长音
250pytorchaudio
StructBERT中文情感分类模型介绍 情感分类任务,通常为输入一段句子或一段话,返回该段话正向/负向的情感极性,在用户评价,观点抽取,意图识别中往往起到重要作用。StructBERT中文情感分类模
230pytorchnlp
基于混合图层的高清人像美肤模型 论文 | github 人像美肤模型可用于对图像中的人体皮肤进行处理,实现匀肤(处理痘印、肤色不均等)、去瑕疵(脂肪粒、斑点、痣等)以及美白等功能。模型仅对裸露的皮肤进
210pytorchcv
15点人体关键点检测模型 输入一张人物图像,实现端到端的人体关键点检测,输出图像中所有人体的15点人体关键点坐标、点位置信度和人体检测框,点位顺序如下图所示。 15点人体关键点 模型描述 该任务采用
190pytorchcv
人像修复介绍 输入一张包含人像的图像,算法会对图像中的每一个检测到的人像做修复和增强,对图像中的非人像区域采用RealESRNet做两倍的超分辨率,最终返回修复后的完整图像。 模型描述 GPEN将预训
200pytorchcv
resnet18-human-detection模型介绍 给定一张输入图像,输出图像中人体的坐标。 期望模型使用方式与适用范围 本模型适用范围较广,覆盖室内外、监控、单人多人等大部分场景。 如何使用
240pytorchcv
StructBERT中文文本相似度模型介绍 StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上,用atec、bqcorpus、chineseST
220pytorchnlp
当前共5187个项目
×
寻找源码
源码描述
联系方式
提交