全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

AI

语音识别-英语-后处理- ITN模型

英语逆文本正则化模型模型描述英语逆文本正则化模型是基于FunTextProcessing开源代码库生成，用于英语语音识别模型结果后处理中的逆文本正则化部分。多语言逆文本正则化&文本正则化逆文本

440pytorchaudio

bert-base-uncased

BERT base model (uncased) Pretrained model on English language using a masked language modeling (MLM

280

BCE - Embedding: 中英双语，及其跨语种embedding模型for RAG

TL; DL 为RAG而生-BCEmbedding技术报告本项目是bce-embedding-base_v1)的国内模型权重下载通道，原模型开源地址huggingface。使用方式： git c

730

OFA视觉问答模型-英文-通用领域-huge

OFA-视觉问答(英文) News 2023年2月: 优化了finetune流程，支持参数更新、自定义数据及脚本分布式训练等，见finetune示例。 2022年11月：新增OFA Tutoria

380pytorchmulti-modal

ERes2Net说话人确认-英文-VoxCeleb-16k-离线-pytorch

ERes2Net 说话人识别模型 ERes2Net模型是在Res2Net的基础上，对全局和局部特征进一步融合，从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号；全局特征融合

380pytorchaudio

RaNER命名实体识别-中文-文学领域-base

RANER介绍模型描述本方法采用Transformer-CRF模型，使用StructBERT作为预训练模型底座，结合使用外部工具召回的相关句子作为额外上下文，使用Multi-View Traini

360pytorchnlp

读光-文字检测-单词检测模型-英文-通用领域

读光文字检测 News 2023年6月：新增轻量化端侧行检测模型和行识别模型 2023年3月：新增DBNet训练/微调流程，支持自定义参数及数据集，详见代码示例。 2023年2月：新增业界主流

980tensorflowcv

语音合成-韩语-通用领域-16k-发音人kyong

Sambert-Hifigan模型介绍框架描述拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用，故此处仅涉及参数法。参数TTS系统可分为两

340pytorchaudio

Paraformer语音识别-中文-通用-8k-离线

Paraformer-large模型介绍 Highlights 热词版本：Paraformer-large热词版模型支持热词定制功能，基于提供的热词列表进行激励增强，提升热词的召回率和准确率。长音

450pytorchaudio

FSMN远场唤醒-双麦-16k-你好米雅

FSMN远场唤醒模型介绍问题背景关键词检测（keyword spotting, KWS），即我们通常所说的语音唤醒，指的是一系列从实时音频流中检测出若干预定义关键词的技术。随着远讲免提语音交互（d

410pytorchaudio

StructBERT文本相似度-中文-电商-base

电商领域StructBERT中文文本相似度模型介绍电商领域StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上，使用电商领域标注数据训练出来的相

530pytorchnlp

全身关键点检测-通用领域-2D

全身133点关键点检测模型输入一张人物图像，端到端检测全身133点关键点，输出人体框和对应的全身关键点，包含68个人脸关键点、42个手势关键点、17个骨骼关键点和6个脚部关键点。 133点人体关键点

1760pytorchcv

孟子T5预训练生成模型-中文-base-多任务

孟子T5预训练生成模型-中文-base-多任务孟子T5多任务模型在mengzi-t5-base的基础上，进一步使用27个数据集和301种prompt进行了多任务的混合训练。关于孟子T5预训练生成模

660pytorchnlp

CAM++说话人确认-通用-16k-中英文版

CAM++说话人识别模型 CAM++模型是基于密集连接时延神经网络的说话人识别模型，具有准确的说话人识别效果和更快的推理速度。该模型使用大规模的中英文说话人数据集进行训练，适用于中英文语种的说话人识别

380pytorchaudio

实时交通标识检测-自动驾驶领域

实时交通标识检测-自动驾驶领域模型介绍本模型为高性能热门应用系列检测模型中的实时交通标识检测模型，基于面向工业落地的高性能检测框架DAMOYOLO，其精度和速度超越当前经典的YOLO系列方法。

460pytorchcv

PST动作识别模型-tiny

动作识别模型介绍模型描述 Patch Shift Transformers(PST) 是在2D Swin-Transformer的基础上，增加temporal建模能力，使网络具备视频时空特征学习能力

530pytorchcv

实时目标检测-自动驾驶领域

通用实时检测模型实时目标检测-自动驾驶领域模型是专注于自动驾驶场景的目标检测模型。模型描述 YOLOX-PAI是阿里云机器学习平台PAI的开源计算机视觉代码库EasyCV中集成的YOLOX算法,

410pytorchcv

RaNER命名实体识别-中文-简历领域-base

RANER介绍模型描述本方法采用Transformer-CRF模型，使用StructBERT作为预训练模型底座，结合使用外部工具召回的相关句子作为额外上下文，使用Multi-view Traini

450pytorchnlp

Mask2Former-R50全景分割

Mask2Former r50-image-panoptic-segmentation模型介绍给定一张输入图像，输出全景分割掩膜，类别，分数（虚拟分数）。全景分割是要分割出图像中的stuff，th

430pytorchcv

基础视觉模型高效调优-Adapter

基础视觉模型高效调优：Adapter 基于大规模预训练基础模型的参数高效迁移学习方法在各种下游应用中均取得了优异的表现，其中包括了利用Adapter进行调优的方法。该方法通过额外添加了类bottlen

340pytorchcv

当前共6720个项目

...10 11 12 13 14 15 16 17 18 19 20 ...

登录后即可上传、下载作品

搜索

分类

影视 ios 性能优化大数据大数据日志分析和统计 ActionScript css 短信API Winform

AI

重点城市程序员兼职推荐

重点岗位程序员兼职推荐