pytorch

文本生成视频大模型-英文-通用领域 (Text-to-video-synthesis Model in Open Domain) 本模型基于多阶段文本到视频生成扩散模型, 输入描述文本,返回符合文本描
320pytorchmulti-modal
Highlights SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测 多语言识别: 采用超过40万小时数据训练,支持超过50种语言,识别效果上优于Whisper模型。 富文本
790pytorch
图像上色介绍 输入一张黑白图片,全自动的输出相对应的彩色图片。 模型描述 DeOldify是图像上色领域比较有名的开源算法,模型利用resnet作为encoder构建一个unet结构的网络,并提出了多
290pytorchcv
ROM语义相关性-中文-电商领域模型介绍 文本检索是信息检索领域的核心问题, 其在很多信息检索、NLP下游任务中发挥着非常重要的作用。 近几年, BERT等大规模预训练语言模型的出现使得文本表示效果有
400pytorchnlp
M2FP单人人体解析模型介绍 模型描述 M2FP(Mask2Former for Parsing,官方代码)基于 Mask2Former 架构,并进行了一些改进以适应人体解析。 M2FP 可以适应几乎
370pytorchcv
日常物体识别模型介绍 自建1300类常见物体标签体系,覆盖常见的日用品,动物,植物,家具,设备,食物等物体,标签从海量中文互联网社区语料进行提取,保留了出现频率较高的常见物体名称。模型结构采用最新的V
430pytorchcv
读光文字识别 News 2023年6月: 新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月: 新增训练/微调时读取本地数据集的lmdb,用训练/
280pytorchcv
News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年09月: 上线Huge模型,欢迎试用。 OFA-图像描述(英
490pytorchmulti-modal
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
360pytorchaudio
OFA-视觉问答(英文) News 2023年2月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年11月: 新增OFA Tutoria
340pytorchmulti-modal
实时人体检测-通用 模型介绍 本模型为高性能热门应用系列检测模型中的 实时人体检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。用户使用的时候,
310pytorchcv
读光文字识别 News 2023年6月: 新增轻量化端侧识别LightweightEdge-通用场景模型和轻量化端侧行检测模型。 2023年4月: 新增训练/微调时读取本地数据集的lmdb,用训练/
260pytorchcv
Qwen-7B-Chat-Int4 ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo
290pytorchqwen
EMOTION2VEC emotion2vec通用语音情感表征模型 emotion2vec: Self-Supervised Pre-Training for S
330pytorch
MossFormer2语音分离模型介绍 本次发布为上一代单声道语音分离算法MossFormer的升级版。并在单声道语音分离任务上比MossFormer取得显著的性能提升。MossFormer模型主要采
360pytorchaudio
Qwen-7B ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo WeChat (微信
370pytorchqwen
GLM-4-9B-Chat Read this in English. 2024/07/24,我们发布了与长文本相关的最新技术解读,关注 这里 查看我们在训练 GLM-4-9B 开源模型中关于长文本技
300glm
SCRFD 模型介绍 人脸检测及关键点模型SCRFD 模型描述 SCRFD为当前SOTA的人脸检测方法,该方法的主要贡献是从两处入手提升检测器在效率和精度的平衡,分别是: Sample Redis
280pytorchcv
票证检测矫正模型介绍 【读光商用矫正模型开源,快来体验吧】票证检测矫正模型在实际生活中有着广泛的需求,例如信息抽取、图像质量判断、证件扫描、票据审计等领等场景,可以大幅提高工作效率和准确性。本次 读光
370pytorchcv
[?Homepage] | [? Chat with DeepSeek LLM] | [Discord] | [Wechat(微信)] 1. Introduction of Deeps
260pytorch
当前共5187个项目
×
寻找源码
源码描述
联系方式
提交