AI

英语逆文本正则化模型 模型描述 英语逆文本正则化模型是基于FunTextProcessing开源代码库生成,用于英语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本正则化 逆文本
440pytorchaudio
BERT base model (uncased) Pretrained model on English language using a masked language modeling (MLM
280
TL; DL 为RAG而生-BCEmbedding技术报告 本项目是bce-embedding-base_v1)的国内模型权重下载通道,原模型开源地址huggingface。 使用方式: git c
730
OFA-视觉问答(英文) News 2023年2月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年11月: 新增OFA Tutoria
380pytorchmulti-modal
ERes2Net 说话人识别模型 ERes2Net模型是在Res2Net的基础上,对全局和局部特征进一步融合,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;全局特征融合
380pytorchaudio
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-View Traini
360pytorchnlp
读光文字检测 News 2023年6月: 新增轻量化端侧行检测模型和行识别模型 2023年3月: 新增DBNet训练/微调流程,支持自定义参数及数据集,详见代码示例。 2023年2月: 新增业界主流
980tensorflowcv
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
340pytorchaudio
Paraformer-large模型介绍 Highlights 热词版本:Paraformer-large热词版模型支持热词定制功能,基于提供的热词列表进行激励增强,提升热词的召回率和准确率。 长音
450pytorchaudio
FSMN远场唤醒模型介绍 问题背景 关键词检测(keyword spotting, KWS),即我们通常所说的语音唤醒,指的是一系列从实时音频流中检测出若干预定义关键词的技术。随着远讲免提语音交互(d
410pytorchaudio
电商领域StructBERT中文文本相似度模型介绍 电商领域StructBERT中文文本相似度模型是在structbert-base-chinese预训练模型的基础上,使用电商领域标注数据训练出来的相
530pytorchnlp
全身133点关键点检测模型 输入一张人物图像,端到端检测全身133点关键点,输出人体框和对应的全身关键点,包含68个人脸关键点、42个手势关键点、17个骨骼关键点和6个脚部关键点。 133点人体关键点
1760pytorchcv
孟子T5预训练生成模型-中文-base-多任务 孟子T5多任务模型在mengzi-t5-base的基础上,进一步使用27个数据集和301种prompt进行了多任务的混合训练。 关于孟子T5预训练生成模
660pytorchnlp
CAM++说话人识别模型 CAM++模型是基于密集连接时延神经网络的说话人识别模型,具有准确的说话人识别效果和更快的推理速度。该模型使用大规模的中英文说话人数据集进行训练,适用于中英文语种的说话人识别
380pytorchaudio
实时交通标识检测-自动驾驶领域 模型介绍 本模型为高性能热门应用系列检测模型中的 实时交通标识检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。
460pytorchcv
动作识别模型介绍 模型描述 Patch Shift Transformers(PST) 是在2D Swin-Transformer的基础上,增加temporal建模能力,使网络具备视频时空特征学习能力
530pytorchcv
通用实时检测模型 实时目标检测-自动驾驶领域模型是专注于自动驾驶场景的目标检测模型。 模型描述 YOLOX-PAI是阿里云机器学习平台PAI的开源计算机视觉代码库EasyCV中集成的YOLOX算法,
410pytorchcv
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Traini
450pytorchnlp
Mask2Former r50-image-panoptic-segmentation模型介绍 给定一张输入图像,输出全景分割掩膜,类别,分数(虚拟分数)。 全景分割是要分割出图像中的stuff,th
430pytorchcv
基础视觉模型高效调优:Adapter 基于大规模预训练基础模型的参数高效迁移学习方法在各种下游应用中均取得了优异的表现,其中包括了利用Adapter进行调优的方法。该方法通过额外添加了类bottlen
340pytorchcv
当前共6720个项目
×
寻找源码
源码描述
联系方式
提交