全部开源项目源文件源码产品系统 AI API 电商运维游戏 APP H5网站 PC网站微信小程序更多

AI

OFA文字识别-中文-日常场景-base

OFA-文字识别 News 2023年1月：优化了finetune流程，支持参数更新、自定义数据及脚本分布式训练等，见finetune示例。 2022年12月：上线创空间：OFA的中文OCR体验

420pytorchmulti-modal

MFCCA多通道多说话人语音识别-中文-AliMeeting-16k-离线

MFCCA多说话人语音识别模型介绍 Highlights 本模型主要是解决会议场景下多说话人语音识别的问题，基于ICASSP2022 M2MeT竞赛发布的真实会议场景语料库AliMeeting进行训练

350pytorchaudio

读光-表格结构识别-无线表格

LORE无线表格结构识别模型介绍表格结构识别，即给定一张图片，检测出图中单元格的物理坐标（四个顶点）以及逻辑坐标（行号列号）。在无线表格中，单元格的物理坐标使用表格内文字的外接框。模型描述本模型

540pytorchcv

Paraformer语音识别-中文-通用-16k-实时-pytorch

Highlights Paraformer 模型是一种非自回归（Non-autoregressive）端到端语音识别模型。非自回归模型相比于自回归模型，可以对整条句子并行输出目标文字，具有更高的计算效

370pytorchaudio

StyleGAN2人脸生成

人像图片生成介绍输入随机种子，基于StyleGAN2人像生成模型，返回高清晰(分辨率为1024x1024)的人像图片。模型描述 StyleGAN是图像生成领域的代表性工作，StyleGAN2在St

290pytorchcv

视频人像抠图模型-通用领域

视频人像抠图（Video human matting）是计算机视觉的经典任务，输入一个视频（图像序列），得到对应视频中人像的alpha图，其中alpha与分割mask不同，mask将视频分为前景与背景

340pytorchcv

Image-to-Video高清图像生成视频大模型

Image-to-Video高清图像生成视频大模型本项目Image-to-Video旨在解决根据输入图像生成高清视频任务。Image-to-Video由达摩院研发的高清视频生成基础模型之一，其核心部

340pytorchmulti-modal

语音合成-中文-通用领域-16k-发音人zhida

Sambert-Hifigan模型介绍框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用，故此处仅涉及参数法。参数TTS系统可分为两

290pytorchaudio

RaNER命名实体识别-中文-小说领域-base

RANER介绍 What's New 2022年12月：训练所使用的序列理解统一框架AdaSeq发布，提供30+ SOTA的复现代码！ RaNER家族模型均可在链接进行访问！所使用的NER数据集均

450pytorchnlp

OFA文字识别-中文-通用场景-base

OFA-文字识别 News 2023年1月：优化了finetune流程，支持参数更新、自定义数据及脚本分布式训练等，见finetune示例。 2022年11月：发布ModelScope 1.0版

360pytorchmulti-modal

异常图像检测

Bad Image Detecting 模型描述基于mobilenet-v2的一个简单基线，可以有效检测异常图像，包括编解码或者图像宽高、行偏移错误等造成的花屏，绿屏图像。 Bad

290pytorchcv

MiniCPM-V

MiniCPM-V News [4/11]?MiniCPM-V-2.0 is out. MiniCPM-V (i.e., OmniLMM-3B) is an efficient version w

340

全中文任务支持零样本学习模型v1.5

全中文任务支持零样本学习模型 PromptCLUE：支持最多中文任务的开源预训练模型这个模型是基于PromptCLUE-base进一步训练(+50%步数)，以及更多任务(+50%任务)以及更多任务类

280pytorchnlp

RaNER命名实体识别-中文-医疗领域-base

RANER介绍 What's New 2023年4月：如当前模型不满足您的需求，请尝试零样本信息抽取能力。具体可以体验我们的创空间！当前在发力优化中，如有相关需求请加我们的钉钉群（41700255

470pytorchnlp

SambertHifigan语音合成-中文-多人预训练-24k

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

360pytorchaudio

人脸重建模型

HRN人脸重建模型论文 | 项目主页 | github 人脸重建模型以单张人像图作为输入，利用层次化表征实现快速人脸几何、纹理恢复，输出高精度3D人脸重建mesh，相关论文HRN已被CVPR2023

410pytorchcv

StructBERT情感分类-中文-电商-base

StructBERT中文情感分类模型介绍情感分类任务，通常为输入一段句子或一段话，返回该段话正向/负向的情感极性，在用户评价，观点抽取，意图识别中往往起到重要作用。而在电商场景中，情感分类显得尤为重

340pytorchnlp

OFA通过描述定位图像物体-中文-通用领域-large

OFA-视觉定位 (中文) 视觉定位是什么？如果你想找出某个物体在图片上的位置，你只需要输入对这个物体的描述，比如“一个圆头的蓝色宝可梦”， OFA模型便能框出它的所在位置。本页面右侧提供了在线体验

330pytorchmulti-modal

DeepLPF图像调色

DeepLPF: Deep Local Parametric Filters for Image Enhancement 模型描述该模型为图像色彩增强模型，输入为待调色的图像，输出为增强后的图像。D

360pytorchcv

口罩人脸识别模型FaceMask

FaceMask 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸比对1:1、口罩人脸比对1:1、人脸搜索1:N、公众人物识别、明星识别。口罩人脸识别模型FaceMask, 推荐使用

280pytorchcv

当前共6711个项目

1 2 3 4 5 6 7 8 9 10 ...

登录后即可上传、下载作品

搜索

分类

前端 Qt Markdown开发包常用JavaScript包微信小程序数据备份餐饮 iOS/iPhone/iPad开发包 3D图形处理库 Object-c

AI

重点城市程序员兼职推荐

重点岗位程序员兼职推荐