AI

DCT-Net人像卡通化模型-3D 论文 | 项目主页 输入一张人物图像,实现端到端全图卡通化转换,生成3D风格虚拟形象,返回风格化后的结果图像。 其生成效果如下所示: >>返回卡通化系列模型专题页
1180tensorflowcv
LaMa image inpainting 图像填充介绍 本模型选自LaMa算法,同时支持高分辨率图像(~2k)在线refinement,对图片进行修复,填充和编辑等。 模型描述 LaMa 采用F
770pytorchcv
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
690pytorchaudio
基于连续语义增强的神经机器翻译模型介绍 本模型基于邻域最小风险优化策略,backbone选用先进的transformer-large模型,编码器和解码器深度分别为24和6,相关论文已发表于ACL 20
1360tensorflownlp
RANER介绍 What's New 2023年8月: 开放域文本理解大模型 已上线,无需训练,即可完成实体识别、文本分类、阅读理解等多种任务! 2023年4月: - 如您需要自定义实体类型,请尝试
620pytorchnlp
基于连续语义增强的神经机器翻译模型介绍 本模型基于邻域最小风险优化策略,backbone选用先进的transformer-large模型,编码器和解码器深度分别为24和6,相关论文已发表于ACL 20
1020tensorflownlp
swinL-image-panoptic-segmentation模型介绍 给定一张输入图像,输出全景分割掩膜,类别,分数(虚拟分数)。 全景分割是要分割出图像中的stuff,things。stuff
540pytorchcv
BaSSL视频场景分割模型介绍 视频场景分割任务:场景(scene)定义为一段在语义上具有连续性的视频片段,视频场景分割指的是将一段视频分成若干个场景。 本模型使用基于ResNet-50的结构
710pytorchcv
coROM中文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大
780pytorchnlp
卡证检测矫正模型介绍 模型描述 在实人认证、文档电子化等场景中需要自动化提取卡证的信息,以便进一步做录入处理。这类场景通常存在两类问题,一是识别卡证类型时易受背景干扰,二是卡证拍摄角度造成的文字畸变影
690pytorchcv
MTCNN 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸检测与五官定位。 人脸检测关键点模型MTCNN 模型描述 MTCNN是工业界广泛应用的检测关键点二合一模型, (论文地址,
570pytorchcv
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
1050pytorchaudio
RetinaFace 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸检测与五官定位。 人脸检测关键点模型RetinaFace 模型描述 RetinaFace为当前学术界和工业界精度较
740pytorchcv
基于序列建模的文本分割模型 该模型基于wiki-zh公开语料训练,对未分割的长文本进行段落分割。提升未分割文本的可读性以及下游NLP任务的性能。 模型描述 随着在线教学、会议等技术的扩展,口语文档的数
710pytorchnlp
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
660pytorchaudio
读光文字识别 News 2023年6月: 新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月: 新增训练/微调时读取本地数据集的lmdb,用训练/
980pytorchcv
u2net-salient-detection模型介绍 给定一张输入图像,输出视觉显著注意力图。 期望模型使用方式与适用范围 本模型适用范围较广,预测像素视觉显著注意程度,但不涉及图像中的语义信息。
740pytorchcv
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
750pytorchaudio
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
710pytorchaudio
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
610pytorchaudio
当前共6720个项目
×
寻找源码
源码描述
联系方式
提交