浦语·灵笔 InternLM-XComposer ? ?   | InternLM-XComposer-VL ? ?   | Technical Report ? [
410pytorch
人脸检测&五官定位模型介绍 人脸检测&五官定位模型。输出与开放视觉平台人脸检测与五官定位 API一致。 参数介绍 模型使用方式和使用范围 本模型可以检测输入图片中人脸的位置,105关键点,人脸po
250pytorch
Highlights 适用于中英文的语音量化编码(Speech Codec)模型,在大规模内部数据上训练得到,适用于多领域场景。 更低的比特率 更高的量化语音质量 训练时采用结构化 dropout,
410pytorchaudio
3DHuman-Syn三维角色驱动 论文 | 项目主页 输入选择的角色ID及动作ID,即可自动绑定驱动生成3D角色动画资产,输出可直接用于现有3D生产管线。 效果展示 3D角色驱动效果如下: 模型
380pytorchcv
基于HRN的text-to-3D head模型 基于HRN的text-to-3D head模型,结合了文生图stable diffusion模型和头部重建模型HRN ,以文本为输入,可生成高质量3D头
380pytorchcv
实时手机检测模型 输入一张图像,对其中的手机进行检测,输出图片中所有目标的检测框、置信度和标签。 视觉模型边缘+端侧部署指南 阿里云免费0代码开发10+种主流芯片的c++硬件加速SDK/性能评估/
350pytorchcv
实时纸箱检测模型 输入一张图像,对其中的纸箱进行检测,输出图片中所有目标的检测框、置信度和标签。 视觉模型边缘+端侧部署指南 阿里云免费0代码开发10+种主流芯片的c++硬件加速SDK/性能评估/
260pytorchcv
实时电动车检测模型 输入一张图像,对其中的电动车进行检测,输出图片中所有目标的检测框、置信度和标签。 视觉模型边缘+端侧部署指南 阿里云免费0代码开发10+种主流芯片的c++硬件加速SDK/性能评
320pytorchcv
实时手势检测模型 输入一张图像,对其中的手势进行检测,输出图片中所有目标的检测框、置信度和标签。 视觉模型边缘+端侧部署指南 阿里云免费0代码开发10+种主流芯片的c++硬件加速SDK/性能评估/
350pytorchcv
Qwen-7B-Chat-Int4 Qwen-7B ? | ?  | Qwen-7B-Chat ? | ?  |  Demo  |  Report   |   Di
360pytorch
ERes2Net 语种识别模型 ERes2Net模型结合全局特征和局部特征,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;全局特征融合使用不同层级输出的不同尺度声学特征
440pytorchaudio
模型介绍 模型描述 EcomGPT是使用大量电商领域任务数据集指令微调得到的模型,在电商领域任务上表现出更好的零样本效果。 相关技术可以参考论文:EcomGPT: Instruction-tuning
280pytorch
ERes2Net 语种识别模型 ERes2Net模型结合全局特征和局部特征,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;全局特征融合使用不同层级输出的不同尺度声学特征
250pytorchaudio
OpenBuddy - Open Multilingual Chatbot GitHub and Usage Guide: https://github.com/OpenBuddy/OpenBuddy
220pytorch
Paraformer-large模型介绍 Highlights 热词版本:Paraformer-large热词版模型支持热词定制功能,基于提供的热词列表进行激励增强,提升热词的召回率和准确率。 长音
940pytorchaudio
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
240pytorchaudio
PolyLM-Qwen-7B-多语言预训练模型 模型简介 PolyLM是一个通晓多种语言的大规模语言模型,涵盖中文、英文、西班牙语、法语、德语、俄语、葡萄牙语、意大利语、阿拉伯语、日语、韩语、泰语、越
360nlp
ERes2Net 语种识别模型 ERes2Net模型结合全局特征和局部特征,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;全局特征融合使用不同层级输出的不同尺度声学特征
350pytorchaudio
ERes2Net 语种识别模型 ERes2Net模型结合全局特征和局部特征,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;全局特征融合使用不同层级输出的不同尺度声学特征
310pytorchaudio
PolyLM多语言文本生成模型(Demo-演示) 模型简介 PolyLM是一个通晓多种语言的大规模语言模型,涵盖中文、英文、西班牙语、法语、德语、俄语、葡萄牙语、意大利语、阿拉伯语、日语、韩语、泰语、
250nlp
当前共161594个项目
×
寻找源码
源码描述
联系方式
提交