AI

Baichuan-13B-Chat 介绍 Baichuan-13B-Chat为Baichuan-13B系列模型中对齐后的版本,预训练模型可见Baichuan-13B-Base。 Baichuan-1
410pytorch
实时安全帽检测-通用 模型介绍 本模型为高性能热门应用系列检测模型中的 实时安全帽检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。用户使用的时
330pytorchcv
OFA-文字识别 News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年11月: 发布ModelScope 1.0版
460pytorchmulti-modal
国画Diffusion This is the fine-tuned Stable Diffusion model trained on traditional Chinese paintings.
390pytorchstable-diffusion
天空替换模型介绍 换天算法是计算机视觉的经典任务之一,也是image sky matting的应用之一。输入一张原图A以及一张参考图B,换天算法会得到两张图片对应的天空区域的alpha图(alpha属
400pytorchcv
PALM文本生成模型介绍 PALM模型是一个通用的预训练生成模型,可以用于解决下游各种类型的生成任务。模型利用大量无监督数据,通过结合自编码和自回归任务进行预训练。可以用于解决文本生成相关的任务包含:
350pytorchnlp
MiniCPM-Llama3-V 2.5: A GPT-4V Level Multimodal LLM on Your Phone GitHub | Demo News ? Pinned [202
360
NAFNet: Nonlinear Activation Free Network for Image Restoration 模型描述 NAFNet(Nonlinear Activation Fre
370pytorchcv
MaSTS中文文本相似度-CLUE语义匹配模型介绍 MaSTS中文文本相似度-CLUE语义匹配模型是基于MaSTS预训练模型-CLUE语义匹配,在QBQTC数据集上训练得到的相似度匹配模型。通过集成此
260pytorchnlp
CoROM语义相关性-英文-通用领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效
380pytorchnlp
passvitb-image-reid-person 模型介绍 本模型为图像特征表示提取别模型,使用ViT作为主干网络,输入图像,输出图像的特征表示(image embedding),图像的特征表示可
330pytorchcv
基础视觉模型高效调优:U-Tuning 论文链接:Rethinking Efficient Tuning Methods from a Unified Perspective(arXiv) 本工作从统
390pytorchcv
Qwen-Audio Qwen-Audio ? | ?  | Qwen-Audio-Chat ? | ?    Demo  |   Homepage  |  P
430qwen
Tiny-NAS 介绍 Tiny-NAS 是一个高性能的神经结构搜索(NAS)框架,用于在GPU和移动设备上自动设计具有高预测精度和高推理速度的深度神经网络。 Zen-NAS 是一种典型的 Tiny-
380pytorchcv
Cascade-Mask-RCNN-Swin实例分割模型介绍 本模型基于Cascade mask rcnn分割框架,backbone选用先进的swin transformer模型。 模型描述 Swin
400pytorchcv
Model Card for InternVL-Chat-V1.5 Two interns holding hands, symbolizing the integration of
220
FastInst快速实例分割模型介绍 模型描述 FastInst是一种简单的基于查询的图像分割框架。它的关键设计包括实例激活引导的查询、双路径更新策略和真值掩码引导的学习。这些组件使我们能够使用更轻量
650pytorchcv
Highlights UniASR俄语语音识别模型,可对近场、低噪、正常语速、朗读形式的俄语音频进行语音识别: ASR模型:UniASR模型,俄语语音识别模型。 ITN模型:俄语ITN模型,可用于语
390pytorchaudio
Video-to-Video高清视频生成视频大模型 MS-Vid2Vid-XL旨在提升视频生成的时空连续性和分辨率,其作为Video-to-Video的第二阶段以生成720P的视频,同时还可以用于文生
370pytorchmulti-modal
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
1820pytorchaudio
当前共6720个项目
×
寻找源码
源码描述
联系方式
提交