AI

实时香烟检测-通用 模型介绍 本模型为高性能热门应用系列检测模型中的 实时香烟检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。用户使用的时候,
260pytorchcv
基于CAM++和聚类的说话人日志系统 输入一段多人对话的音频,本模型可以自动的识别音频中的对话人数,并且对其进行区分,适合用于客服对话、会议讨论、采访等场景,该系统配合语音识别可进一步搭建多人对话的语
450pytorchaudio
StructBERT零样本分类模型介绍 模型详细介绍及实现原理可参考评测文章:世界那么大,我想去看看——探索ModelScope之零样本分类 Yin等人[1]提出了一种使用预训练的自然语言推理模型来实
650pytorchnlp
NAFNet: Nonlinear Activation Free Network for Image Restoration 模型描述 NAFNet(Nonlinear Activation Fre
410pytorchcv
人像抠图介绍 人像抠图对输入含有人像的图像进行处理,无需任何额外输入,实现端到端人像抠图,输出四通道人像抠图结果,如下图所示: 抠图系列模型 图像人像抠图 通用抠图(支持商
1180tensorflowcv
Cycle-CenterNet表格结构识别模型介绍 表格结构识别,即给定一张图片,检测出图中单元格的物理坐标(四个顶点)以及逻辑坐标(行号列号)。 模型描述 本模型是以自底向上的方式: 1)基于单元格
630pytorchcv
Highlights UniASR粤语简体语音识别模型,可对近场、低噪、正常语速、朗读形式的粤语简体音频进行语音识别: ASR模型:UniASR模型,粤语简体语音识别模型。 ITN模型:粤语简体IT
540pytorchaudio
StructBERT中文情感分类模型介绍 情感分类任务,通常为输入一段句子或一段话,返回该段话正向/负向的情感极性,在用户评价,观点抽取,意图识别中往往起到重要作用。StructBERT中文情感分类模
430pytorchnlp
Image Quality Assessment for UGC 模型描述 基于resnet的一个简单基线,可以有效评估图像的无参考画质,达到SOTA性能。其网络结构如下图所示: i
340pytorchcv
SiameseUniNLU通用自然语言理解模型介绍 SiameseUniNLU通用自然语言理解模型,基于提示(Prompt)+文本(Text)的构建思路,通过设计适配于多种任务的Prompt,并利用指
660pytorchnlp
模型描述 这里我们提供基于业界领先的目标检测框架DAMO-YOLO训练的检测模型:DAMO-YOLO-S。DAMO-YOLO是一个面向工业落地的目标检测框架,兼顾模型速度与精度,其训练的模型效果超越了
380pytorchcv
人像修复介绍 输入一张包含人像的图像,算法会对图像中的每一个检测到的人像做修复和增强,对图像中的非人像区域采用RealESRNet做两倍的超分辨率,最终返回修复后的完整图像。 模型描述 GPEN将预训
270pytorchcv
Qwen-VL ? ?  | Qwen-VL-Chat ? ?  (Int4: ? ? ) | Qwen-VL-Plus ? ?  |
780pytorch
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
320pytorchaudio
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Paraformer-
940pytorchaudio
Baichuan 2 ?GitHub | ?WeChat | ?Demo ? 百川大模型在线对话平台 已正式向公众开放 ? 目录 ? 模型介绍 ⚙️ 快速开始 ? Be
330pytorch
CSRNet: Conditional Sequential Modulation for Efficient Global Image Retouching 模型描述 该模型为图像调色模型,输入为待
450pytorchcv
StructBERT中文文本相似度模型介绍 StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上,用atec、bqcorpus、chineseST
380pytorchnlp
FAQ问答任务介绍 FAQ问答是智能对话系统(特别是垂直领域对话系统)的核心业务场景,业务专家基于经验或数据挖掘的结果,将用户会频繁问到的业务知识以Q&A的形式维护起来,称之为知识库, 当用户使用对话
370pytorchnlp
读光文字识别 News 2023年6月: 新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月: 新增训练/微调时读取本地数据集的lmdb,用训练/
380pytorchcv
当前共6711个项目
×
寻找源码
源码描述
联系方式
提交