全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

AI

StructBERT情感分类-中文-通用-large

StructBERT中文情感分类模型介绍情感分类任务，通常为输入一段句子或一段话，返回该段话正向/负向的情感极性，在用户评价，观点抽取，意图识别中往往起到重要作用。StructBERT中文情感分类模

600pytorchnlp

DCT-Net人像卡通化-扩散模型-漫画

>>返回卡通化系列模型专题页 DCT-Net人像卡通化-扩散模型-漫画风论文｜项目主页输入一张人物图像，实现端到端全图卡通化转换，生成漫画风格虚拟形象，返回风格化后的结果图像。其生成效果如下

1080tensorflowcv

xvector说话人确认-中文-cnceleb-16k-离线-pytorch

Highlights 说话人确认和声纹提取模型，训练数据集多领域数据 CN-Celeb 1&2 会议场景 AliMeeting 支持功能：提取一段语音的说话人嵌入码 speaker embe

750pytorchaudio

基于神经窗口全连接CRFs的单目深度估计

单目深度估计算法介绍任务输入一张单目RGB图像，单目深度估计算法将分析场景三维结构、输出图像对应的稠密深度图模型描述本模型基于NeW CRFs: Neural Window Fully-con

730pytorchcv

PALM 2.0摘要生成模型-中文-base

PALM中文摘要生成模型 PALM预训练语言生成模型是针对实际场景中常见的文本生成需求所设计的一个模型。模型利用大量无监督数据，通过结合自编码和自回归任务进行预训练，更贴合下游生成任务所同时需要的理解

700pytorchnlp

DUT-RAFT视频稳像

DUT-RAFT 视频稳像模型该模型为抖动视频稳像模型，输入一个抖动视频，实现端到端的视频稳像（视频去抖动），返回稳像处理后的稳定视频。模型效果如下，Demo中的测试视频源来自DVS开源数据集。

730pytorchcv

CoROM文本向量-英文-通用领域-base

coROM英文通用文本表示模型文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展，尤其是预训练语言模型的出现极大

480pytorchnlp

通义千问-1_8B-Chat-Int4

Qwen-1.8B-Chat-Int4 ? Hugging Face | ? ModelScope | ? Paper ｜ ?️ Demo

490pytorchqwen

BEiTv2图像分类-通用-large

通用预训练模型介绍 BEiTv2(large模型，在ImageNet-1k上预训练，并在ImageNet-21k上进行微调) BEiTv2模型先在ImageNet-1k(1419万张图像,1000个类

510pytorchcv

RaNER命名实体识别-英语-电商领域-large

RANER介绍 What's New 2022年12月：训练所使用的序列理解统一框架AdaSeq发布，提供30+ SOTA的复现代码！ RaNER家族模型均可在链接进行访问！所使用的NER数据集均

620pytorchnlp

商品显著性图像分割-电商领域

商品显著性分割模型此模型在商品显著性分割数据集上进行训练，主要对商品图像进行显著性分割。模型在fss1000通用分割数据集上进行了zero shot测试。模型结构信息模型结构为Dense

610pytorchcv

读光-文字识别-行识别模型-中英-车牌文本领域

读光文字识别 News 2023年6月：新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月：新增训练/微调时读取本地数据集的lmdb，用训练/

570pytorchcv

UniASR语音识别-中文-通用-16k-实时

UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调，研究人员和开发人员可以更方便地进行语音识别模型

730pytorchaudio

WeNet-U2pp_Conformer-语音识别-中文-16k-实时

U2++ Conformer 模型介绍模型描述 WeNet 中采用的 U2 模型，如下图所示，该模型使用 Joint CTC/AED 的结构，训练时使用 CTC 和 Attention Loss 联

730torchaudio

通义千问-Audio-Chat

Qwen-Audio-Chat Qwen-Audio ? | ? ｜ Qwen-Audio-Chat ? | ? Demo | Homepage

620qwen

PALM 2.0商品文案生成-中文-base

PALM商品文案描述生成介绍 PALM模型是一个通用的预训练生成模型，可以用于解决下游各种类型的生成任务。模型利用大量无监督数据，通过结合自编码和自回归任务进行预训练。可以用于解决文本生成相关的任务包

550pytorchnlp

StructBERT文本相似度-中文-通用-large

StructBERT中文文本相似度模型介绍 StructBERT中文文本相似度模型是在structbert-large-chinese预训练模型的基础上，用atec、bqcorpus、chineseS

520pytorchnlp

YOLOPV2车辆检测车道线分割-自动驾驶领域

YOLOPV2全景驾驶感知模型介绍 YOLOPv2 适用于自动驾驶场景下的实时全景驾驶感知, 同时执行三种不同的任务，分别为车辆检测，可行驶区域分割以及车道线分割。模型描述 YOLOPv2(官方代码

620pytorchcv

语音合成-中文-多情感领域-16k-发音人Zhibei

Sambert-Hifigan模型介绍模型体验及训练教程详见:Sambert-Hifigan模型训练教程框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TT

610pytorchaudio

MogFace人脸检测模型-large

MogFace 模型介绍稳定调用及效果更好的API，详见视觉开放智能平台：人脸检测与五官定位。人脸检测模型MogFace 模型描述 MogFace为当前SOTA的人脸检测方法，已在Wider Fa

620pytorchcv

当前共6720个项目

...10 11 12 13 14 15 16 17 18 19 20 ...

登录后即可上传、下载作品

搜索

分类

手机开发工具常用工具包 c++建站系统网络爬虫直播 JavaScript MVC 框架餐饮医疗可视化

AI

重点城市程序员兼职推荐

重点岗位程序员兼职推荐