Highlights UniASR印尼语语音识别模型,可对近场、低噪、正常语速、朗读形式的印尼语音频进行语音识别: ASR模型:UniASR模型,印尼语语音识别模型。 ITN模型:印尼语ITN模型,
410pytorchaudio
RANER介绍 What's New 2022年12月: 训练所使用的序列理解统一框架AdaSeq发布,提供30+ SOTA的复现代码! RaNER家族模型均可在链接进行访问!所使用的NER数据集均
460pytorchnlp
GitHub | Demo News [2024.04.23] MiniCPM-V 2.0 supports vLLM now! [2024.04.18] We create a HuggingF
330
VGen VGen is an open-source video synthesis codebase developed by the Tongyi Lab of Alibaba Group,
250pytorchmulti-modal
ECAPA-TDNN说话人模型 ECAPA-TDNN模型是基于时延神经网络构建的说话人模型,由于识别性能优异,已经被广泛使用在说话人识别领域中,还可用于说话人日志和语种识别等任务。 模型结构简述 EC
500pytorchaudio
DFSMN远场唤醒模型介绍 问题背景 关键词检测(keyword spotting, KWS),即我们通常所说的语音唤醒,指的是一系列从实时音频流中检测出若干预定义关键词的技术。随着远讲免提语音交互(
390pytorchaudio
FLXC 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸活体检测、红外人脸活体检测、视频活体检测。 静默炫彩人脸活体检测模型FLXC 模型描述 用来检测图片中的人脸是否为来自认证设备
870pytorchcv
FLIR 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸活体检测、红外人脸活体检测、视频活体检测。 IR 人脸活体检测模型FLIR 模型描述 用来检测图片中的人脸是否为来自认证设备端
830pytorchcv
Segformer-B4语义分割模型介绍 其它相关模型体验Mask2Former-R50全景分割 模型描述 Neurips2021文章SegFormer: Simple and Efficient
330pytorchcv
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用xlm-roberta-large作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view
260pytorchnlp
17点人体关键点检测模型 输入一张人物图像,实现端到端的人体关键点检测,输出视频中每一帧图像人体的17点人体3D关键点坐标。 17点人体关键点 3D人体关键点系列模型 HDForm
290pytorchcv
UniASR 模型介绍 模型描述 UniASR 模型是一种2遍刷新模型(Two pass)端到端语音识别模型。日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。一方面,离线语
470pytorchaudio
UniASR 模型介绍 模型描述 UniASR 模型是一种2遍刷新模型(Two pass)端到端语音识别模型。日益丰富的业务需求,不仅要求识别效果精度高,而且要求能够实时地进行语音识别。一方面,离线语
410pytorchaudio
商品图像特征模型介绍 本模型是对商品图像进行表征向量提取,用户可基于表征向量进行大规模的同款/相似款商品搜索;无需额外输入,模型可自动进行箱包商品的主体抠图,并基于主体提取结果完成表征向量提取。 模型
190pytorchcv
English  |   中文 Building the Next Generation of Open-Source and
270
English  |   中文 Building the Next Generation of Open-Source and
300
Vicuna Model Card Model Details Vicuna is a chat assistant trained by fine-tuning Llama 2 on user-sh
340pytorch
Chat & support: TheBloke's Discord server Want to contribute? TheBloke's Patreon p
170llama-2
ChatGLM-6B-Int4模型介绍 ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结
340pytorchnlp
语音唤醒模型介绍 模型描述   移动端语音唤醒模型,检测关键词为"Yes/No/Up/Down/Left/Right/On/Off/Stop/Go"10个英文单词。   模型网络结构继承自论文《Com
320pytorchaudio
当前共161626个项目
×
寻找源码
源码描述
联系方式
提交