AI

Controllable Time-delay Transformer模型介绍 Highlights 中文标点通用模型:可用于语音识别模型输出文本的标点预测,支持中英文输入。 基于Paraforme
1680pytorchaudio
API Platform | How to Use | License | Paper Link?️ DeepSeek-Coder-V2: Breaking the Barrier
1320pytorch
GTE中文通用文本表示模型(large) 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型
2640pytorchnlp
Highlights Paraformer 模型是一种非自回归(Non-autoregressive)端到端语音识别模型。非自回归模型相比于自回归模型,可以对整条句子并行输出目标文字,具有更高的计算效
3150pytorchaudio
API Platform | How to Use | License | Paper Link?️ DeepSeek-Coder-V2: Breaking the Barrier
1810
Qwen-7B-Chat ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo WeCha
2260pytorchqwen
漫芽糖绘画源文件源码
漫芽糖(绘画)APP是一款以二次元涂色勾线游戏为主要玩法的00后二次元社区APP,也包含了绘画工具。涂色玩法灵感来自涂色绘本《秘密花园》,主要用户群体是00后二次元爱好者。用户能给线稿上色,上色纹理自动生成;上传图片进行勾线,临摹提高;使用应用内置的画笔和工具,创建绘画作品;也可以社区在社区中发表作品,拜师收徒,扩列交友,加入社团等。
940
Roberta文本分类源文件源码
采用Roberta对本地IMDB数据库进行情感二分类。这段代码定义并训练一个基于RoBERTa的文本分类模型,使用IMDB电影评论数据集进行训练和验证。首先通过IMDBDataset类加载并预处理数据,然后利用DataLoader创建数据加载器。在训练过程中,模型使用AdamW优化器,评估指标包括损失、准确率和召回率。每个训练周期结束后,保存模型权重,并在验证集上评估模型性能。代码还包含进度条显示和种子设置,以确保结果的可重复性。
1260python自然语言处理
CAM++识别模型 CAM++模型是基于密集连接时延神经网络的识别模型。相比于一些主流模型,比如ResNet34和ECAPA-TDNN,CAM++具有更准确的识别性能和更快的推理速度。该模型可以用于语
2120pytorchaudio
GTE中文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大的推
1800pytorchnlp
基于混合图层的高清人像美肤模型 论文 | github 人像美肤模型可用于对图像中的人体皮肤进行处理,实现匀肤(处理痘印、肤色不均等)、去瑕疵(脂肪粒、斑点、痣等)以及美白等功能。模型仅对裸露的皮肤进
2010pytorchcv
图像人脸融合 给定一张模板图和一张目标用户图,图像人脸融合模型能够自动地将用户图中的人脸融合到模板人脸图像中,生成一张与目标人脸相似,且具有模版图外貌特征的新图像。 其生成效果如下所示: 模型描述
2150pytorchcv
Qwen-14B-Chat ? Hugging Face   |   ? ModelScope   |    ? Paper    |   ?️ Demo WeCh
1630pytorchqwen
Paraformer-large模型介绍 Highlights Paraformer-large热词版模型支持热词定制功能:实现热词定制化功能,基于提供的热词列表进行激励增强,提升热词的召回率和准确率
4300pytorchaudio
CAM++说话人识别模型 CAM++模型是基于密集连接时延神经网络的说话人识别模型。相比于一些主流的说话人识别模型,比如ResNet34和ECAPA-TDNN,CAM++具有更准确的说话人识别性能和更
1560pytorchaudio
ERes2Net 说话人识别模型 ERes2Net模型是在Res2Net的基础上,对全局和局部特征进一步融合,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;全局特征融合
1830pytorchaudio
Model Download | Evaluation Results | Model Architecture | API Platform | License | Citati
1960pytorch
Highlights Paraformer-large长音频说话人模型在普通长音频版基础上集成了CAM++说话人聚类分类功能,返回的结果中添加了句子级别的说话人分类结果。 Paraformer-la
2160pytorchaudio
行人属性检测模型 输入一张图像,先进行人检测,再对检测到的人体区域进行属性检识别,输出所有人体区域检测框和属性值。 模型描述 该模型主要用于行人属性识别任务,从图像中检测出人体框坐标和属性。该任务使用
1960pytorchcv
基于HRN的高精度人头重建模型 人头重建模型以单张人像图作为输入,基于人脸重建模型HRN ,利用层次化表征实现快速人脸几何、纹理恢复,输出高精度3D人头重建mesh。 三维视觉系列模型
1480pytorchcv
当前共6711个项目
×
寻找源码
源码描述
联系方式
提交