全部开源项目源文件源码产品系统 AI API 电商运维游戏 APP H5网站 PC网站微信小程序更多

AI

实时香烟检测-通用

实时香烟检测-通用模型介绍本模型为高性能热门应用系列检测模型中的实时香烟检测模型，基于面向工业落地的高性能检测框架DAMOYOLO，其精度和速度超越当前经典的YOLO系列方法。用户使用的时候，

260pytorchcv

CAM++说话人日志-对话场景角色区分-通用

基于CAM++和聚类的说话人日志系统输入一段多人对话的音频，本模型可以自动的识别音频中的对话人数，并且对其进行区分，适合用于客服对话、会议讨论、采访等场景，该系统配合语音识别可进一步搭建多人对话的语

450pytorchaudio

StructBERT零样本分类-中文-base

StructBERT零样本分类模型介绍模型详细介绍及实现原理可参考评测文章：世界那么大，我想去看看——探索ModelScope之零样本分类 Yin等人[1]提出了一种使用预训练的自然语言推理模型来实

650pytorchnlp

NAFNet图像去噪

NAFNet: Nonlinear Activation Free Network for Image Restoration 模型描述 NAFNet（Nonlinear Activation Fre

410pytorchcv

BSHM人像抠图

人像抠图介绍人像抠图对输入含有人像的图像进行处理，无需任何额外输入，实现端到端人像抠图，输出四通道人像抠图结果，如下图所示：抠图系列模型图像人像抠图通用抠图(支持商

1180tensorflowcv

读光-表格结构识别-有线表格

Cycle-CenterNet表格结构识别模型介绍表格结构识别，即给定一张图片，检测出图中单元格的物理坐标（四个顶点）以及逻辑坐标（行号列号）。模型描述本模型是以自底向上的方式: 1）基于单元格

630pytorchcv

UniASR语音识别-粤语简体-通用-16k-离线

Highlights UniASR粤语简体语音识别模型，可对近场、低噪、正常语速、朗读形式的粤语简体音频进行语音识别： ASR模型：UniASR模型，粤语简体语音识别模型。 ITN模型：粤语简体IT

540pytorchaudio

StructBERT情感分类-中文-通用-base

StructBERT中文情感分类模型介绍情感分类任务，通常为输入一段句子或一段话，返回该段话正向/负向的情感极性，在用户评价，观点抽取，意图识别中往往起到重要作用。StructBERT中文情感分类模

430pytorchnlp

图像质量MOS评估

Image Quality Assessment for UGC 模型描述基于resnet的一个简单基线，可以有效评估图像的无参考画质，达到SOTA性能。其网络结构如下图所示： i

340pytorchcv

SiameseUniNLU零样本通用自然语言理解-中文-base

SiameseUniNLU通用自然语言理解模型介绍 SiameseUniNLU通用自然语言理解模型，基于提示（Prompt）+文本（Text）的构建思路，通过设计适配于多种任务的Prompt，并利用指

660pytorchnlp

DAMOYOLO-高性能通用检测模型-S

模型描述这里我们提供基于业界领先的目标检测框架DAMO-YOLO训练的检测模型：DAMO-YOLO-S。DAMO-YOLO是一个面向工业落地的目标检测框架，兼顾模型速度与精度，其训练的模型效果超越了

380pytorchcv

GPEN人像增强修复-大分辨率人脸

人像修复介绍输入一张包含人像的图像，算法会对图像中的每一个检测到的人像做修复和增强，对图像中的非人像区域采用RealESRNet做两倍的超分辨率，最终返回修复后的完整图像。模型描述 GPEN将预训

270pytorchcv

通义千问-VL-Chat

Qwen-VL ? ? ｜ Qwen-VL-Chat ? ? (Int4: ? ? ) ｜ Qwen-VL-Plus ? ? ｜

780pytorch

语音合成-中文-多情感领域-16k-发音人Zhiyan

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

320pytorchaudio

UniASR语音识别-中文方言-通用-16k-离线

Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能，可直接对时长为数小时音频进行识别，并输出带标点文字与时间戳： ASR模型：Paraformer-

940pytorchaudio

百川2-13B-对话模型

Baichuan 2 ?GitHub | ?WeChat | ?Demo ? 百川大模型在线对话平台已正式向公众开放 ? 目录 ? 模型介绍 ⚙️ 快速开始 ? Be

330pytorch

CSRNet图像调色

CSRNet: Conditional Sequential Modulation for Efficient Global Image Retouching 模型描述该模型为图像调色模型，输入为待

450pytorchcv

StructBERT文本相似度-中文-通用-base

StructBERT中文文本相似度模型介绍 StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上，用atec、bqcorpus、chineseST

380pytorchnlp

StructBERT FAQ问答-中文-通用领域-base

FAQ问答任务介绍 FAQ问答是智能对话系统(特别是垂直领域对话系统)的核心业务场景，业务专家基于经验或数据挖掘的结果，将用户会频繁问到的业务知识以Q&A的形式维护起来，称之为知识库，当用户使用对话

370pytorchnlp

读光-文字识别-行识别模型-中英-文档印刷体文本领域

读光文字识别 News 2023年6月：新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月：新增训练/微调时读取本地数据集的lmdb，用训练/

380pytorchcv

当前共6711个项目

1 2 3 4 5 6 7 8 9 10 ...

登录后即可上传、下载作品

搜索

分类

前端 Qt Markdown开发包常用JavaScript包微信小程序数据备份餐饮 iOS/iPhone/iPad开发包 3D图形处理库 Object-c

AI

重点城市程序员兼职推荐

重点岗位程序员兼职推荐