全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

AI

DCT-Net人像卡通化-3D

DCT-Net人像卡通化模型-3D 论文｜项目主页输入一张人物图像，实现端到端全图卡通化转换，生成3D风格虚拟形象，返回风格化后的结果图像。其生成效果如下所示： >>返回卡通化系列模型专题页

1180tensorflowcv

LaMa图像填充

LaMa image inpainting 图像填充介绍本模型选自LaMa算法，同时支持高分辨率图像(~2k)在线refinement，对图片进行修复，填充和编辑等。模型描述 LaMa 采用F

770pytorchcv

语音合成-美式英文-通用领域-16k-发音人Annie

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

690pytorchaudio

CSANMT连续语义增强机器翻译-中英-通用领域-large

基于连续语义增强的神经机器翻译模型介绍本模型基于邻域最小风险优化策略，backbone选用先进的transformer-large模型，编码器和解码器深度分别为24和6，相关论文已发表于ACL 20

1360tensorflownlp

RaNER命名实体识别-中文-新闻领域-base

RANER介绍 What's New 2023年8月：开放域文本理解大模型已上线，无需训练，即可完成实体识别、文本分类、阅读理解等多种任务！ 2023年4月： - 如您需要自定义实体类型，请尝试

620pytorchnlp

CSANMT连续语义增强机器翻译-英中-通用领域-large

1020tensorflownlp

Mask2Former-SwinL全景分割

swinL-image-panoptic-segmentation模型介绍给定一张输入图像，输出全景分割掩膜，类别，分数（虚拟分数）。全景分割是要分割出图像中的stuff，things。stuff

540pytorchcv

BaSSL视频场景分割-长视频领域

BaSSL视频场景分割模型介绍视频场景分割任务：场景（scene）定义为一段在语义上具有连续性的视频片段，视频场景分割指的是将一段视频分成若干个场景。本模型使用基于ResNet-50的结构

710pytorchcv

CoROM文本向量-中文-通用领域-base

coROM中文通用文本表示模型文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展，尤其是预训练语言模型的出现极大

780pytorchnlp

卡证检测矫正模型

卡证检测矫正模型介绍模型描述在实人认证、文档电子化等场景中需要自动化提取卡证的信息，以便进一步做录入处理。这类场景通常存在两类问题，一是识别卡证类型时易受背景干扰，二是卡证拍摄角度造成的文字畸变影

690pytorchcv

Mtcnn人脸检测关键点模型

MTCNN 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸检测与五官定位。人脸检测关键点模型MTCNN 模型描述 MTCNN是工业界广泛应用的检测关键点二合一模型, (论文地址,

570pytorchcv

语音合成-中文-多情感领域-16k-多发音人

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

1050pytorchaudio

RetinaFace人脸检测关键点模型

RetinaFace 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸检测与五官定位。人脸检测关键点模型RetinaFace 模型描述 RetinaFace为当前学术界和工业界精度较

740pytorchcv

BERT文本分割-中文-通用领域

基于序列建模的文本分割模型该模型基于wiki-zh公开语料训练，对未分割的长文本进行段落分割。提升未分割文本的可读性以及下游NLP任务的性能。模型描述随着在线教学、会议等技术的扩展，口语文档的数

710pytorchnlp

语音合成-美式英文-通用领域-16k-发音人Andy

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

660pytorchaudio

读光-文字识别-行识别模型-中英-通用领域

读光文字识别 News 2023年6月：新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月：新增训练/微调时读取本地数据集的lmdb，用训练/

980pytorchcv

U2Net图像显著性检测

u2net-salient-detection模型介绍给定一张输入图像，输出视觉显著注意力图。期望模型使用方式与适用范围本模型适用范围较广，预测像素视觉显著注意程度，但不涉及图像中的语义信息。

740pytorchcv

语音合成-英式英文-通用领域-16k-发音人Luna

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

750pytorchaudio

UniASR语音识别-日语-通用-16k-离线

UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调，研究人员和开发人员可以更方便地进行语音识别模型

710pytorchaudio

语音合成-英式英文-通用领域-16k-发音人Luca

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

610pytorchaudio

当前共6720个项目

1 2 3 4 5 6 7 8 9 10 ...

登录后即可上传、下载作品

搜索

分类

影视 ios 性能优化大数据大数据日志分析和统计 ActionScript css 短信API Winform

AI

重点城市程序员兼职推荐

重点岗位程序员兼职推荐