pytorch

Highlights Paraformer-large长音频模型集成VAD、ASR、标点,可直接对时长为数小时音频进行识别,并输出带标点文字: ASR模型:Parformer-large模型结构为非
210pytorchaudio
Qwen-1.8B-Chat-Int8 ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo
200qwen
DFSMN回声消除模型介绍 本模型是一种音频通话场景的单通道回声消除模型算法。 模型描述 模型接受单通道麦克风信号和单通道参考信号作为输入,输出线性回声消除和回声残余抑制后的音频信号。其中,线性回声消
310pytorchaudio
Video-to-Video高清视频生成视频大模型 MS-Vid2Vid-XL旨在提升视频生成的时空连续性和分辨率,其作为Video-to-Video的第二阶段以生成720P的视频,同时还可以用于文生
160pytorchmulti-modal
基础视觉模型高效调优:U-Tuning 论文链接:Rethinking Efficient Tuning Methods from a Unified Perspective(arXiv) 本工作从统
180pytorchcv
FastInst快速实例分割模型介绍 模型描述 FastInst是一种简单的基于查询的图像分割框架。它的关键设计包括实例激活引导的查询、双路径更新策略和真值掩码引导的学习。这些组件使我们能够使用更轻量
150pytorchcv
ROM语义相关性-中文-医疗领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效果有
170pytorchnlp
实时安全帽检测-通用 模型介绍 本模型为高性能热门应用系列检测模型中的 实时安全帽检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。用户使用的时
170pytorchcv
MiniCPM-Llama3-V 2.5: A GPT-4V Level Multimodal LLM on Your Phone GitHub | Demo News ? Pinned [202
170
生活垃圾分类模型介绍 自建265类常见的生活垃圾标签体系,15w张图片数据,包含可回收垃圾、厨余垃圾、有害垃圾、其他垃圾4个标准垃圾大类,覆盖常见的食品,厨房用品,家具,家电等生活垃圾小类共265个,
270pytorchcv
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
470pytorchaudio
passvitb-image-reid-person 模型介绍 本模型为图像特征表示提取别模型,使用ViT作为主干网络,输入图像,输出图像的特征表示(image embedding),图像的特征表示可
150pytorchcv
MaSTS中文文本相似度-CLUE语义匹配模型介绍 MaSTS中文文本相似度-CLUE语义匹配模型是基于MaSTS预训练模型-CLUE语义匹配,在QBQTC数据集上训练得到的相似度匹配模型。通过集成此
160pytorchnlp
Cascade-Mask-RCNN-Swin实例分割模型介绍 本模型基于Cascade mask rcnn分割框架,backbone选用先进的swin transformer模型。 模型描述 Swin
150pytorchcv
PALM文本生成模型介绍 PALM模型是一个通用的预训练生成模型,可以用于解决下游各种类型的生成任务。模型利用大量无监督数据,通过结合自编码和自回归任务进行预训练。可以用于解决文本生成相关的任务包含:
130pytorchnlp
Qwen-72B-Chat-Int8 ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo
180qwen
Tiny-NAS 介绍 Tiny-NAS 是一个高性能的神经结构搜索(NAS)框架,用于在GPU和移动设备上自动设计具有高预测精度和高推理速度的深度神经网络。 Zen-NAS 是一种典型的 Tiny-
180pytorchcv
OFA-文字识别 News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年11月: 发布ModelScope 1.0版
160pytorchmulti-modal
swinL-image-semantic-segmentation模型介绍 给定一张输入图像,输出语义分割掩膜,类别,分数(虚拟分数)。 相关模型体验Mask2Former-R50全景分割 模型描述
150pytorchcv
Qwen-72B ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo WeChat (微
160pytorchqwen
当前共5187个项目
×
寻找源码
源码描述
联系方式
提交