AI

StructBERT中文情感分类模型介绍 情感分类任务,通常为输入一段句子或一段话,返回该段话正向/负向的情感极性,在用户评价,观点抽取,意图识别中往往起到重要作用。StructBERT中文情感分类模
600pytorchnlp
>>返回卡通化系列模型专题页 DCT-Net人像卡通化-扩散模型-漫画风 论文 | 项目主页 输入一张人物图像,实现端到端全图卡通化转换,生成漫画风格虚拟形象,返回风格化后的结果图像。 其生成效果如下
1080tensorflowcv
Highlights 说话人确认和声纹提取模型,训练数据集 多领域数据 CN-Celeb 1&2 会议场景 AliMeeting 支持功能: 提取一段语音的说话人嵌入码 speaker embe
750pytorchaudio
单目深度估计算法介绍 任务 输入一张单目RGB图像,单目深度估计算法将分析场景三维结构、输出图像对应的稠密深度图 模型描述 本模型基于NeW CRFs: Neural Window Fully-con
730pytorchcv
PALM中文摘要生成模型 PALM预训练语言生成模型是针对实际场景中常见的文本生成需求所设计的一个模型。模型利用大量无监督数据,通过结合自编码和自回归任务进行预训练,更贴合下游生成任务所同时需要的理解
700pytorchnlp
DUT-RAFT 视频稳像模型 该模型为抖动视频稳像模型,输入一个抖动视频,实现端到端的视频稳像(视频去抖动),返回稳像处理后的稳定视频。 模型效果如下,Demo中的测试视频源来自DVS开源数据集。
730pytorchcv
coROM英文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大
480pytorchnlp
Qwen-1.8B-Chat-Int4 ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo
490pytorchqwen
通用预训练模型介绍 BEiTv2(large模型,在ImageNet-1k上预训练,并在ImageNet-21k上进行微调) BEiTv2模型先在ImageNet-1k(1419万张图像,1000个类
510pytorchcv
RANER介绍 What's New 2022年12月: 训练所使用的序列理解统一框架AdaSeq发布,提供30+ SOTA的复现代码! RaNER家族模型均可在链接进行访问!所使用的NER数据集均
620pytorchnlp
商品显著性分割模型 此模型在商品显著性分割数据集上进行训练,主要对商品图像进行显著性分割。 模型在fss1000通用分割数据集上进行了zero shot测试。 模型结构信息 模型结构为Dense
610pytorchcv
读光文字识别 News 2023年6月: 新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月: 新增训练/微调时读取本地数据集的lmdb,用训练/
570pytorchcv
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
730pytorchaudio
U2++ Conformer 模型介绍 模型描述 WeNet 中采用的 U2 模型,如下图所示,该模型使用 Joint CTC/AED 的结构,训练时使用 CTC 和 Attention Loss 联
730torchaudio
Qwen-Audio-Chat Qwen-Audio ? | ?  | Qwen-Audio-Chat ? | ?    Demo  |   Homepage 
620qwen
PALM商品文案描述生成介绍 PALM模型是一个通用的预训练生成模型,可以用于解决下游各种类型的生成任务。模型利用大量无监督数据,通过结合自编码和自回归任务进行预训练。可以用于解决文本生成相关的任务包
550pytorchnlp
StructBERT中文文本相似度模型介绍 StructBERT中文文本相似度模型是在structbert-large-chinese预训练模型的基础上,用atec、bqcorpus、chineseS
520pytorchnlp
YOLOPV2全景驾驶感知模型介绍 YOLOPv2 适用于自动驾驶场景下的实时全景驾驶感知, 同时执行三种不同的任务,分别为车辆检测,可行驶区域分割以及车道线分割。 模型描述 YOLOPv2(官方代码
620pytorchcv
Sambert-Hifigan模型介绍 模型体验及训练教程详见:Sambert-Hifigan模型训练教程 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT
610pytorchaudio
MogFace 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸检测与五官定位。 人脸检测模型MogFace 模型描述 MogFace为当前SOTA的人脸检测方法,已在Wider Fa
620pytorchcv
当前共6720个项目
×
寻找源码
源码描述
联系方式
提交