首页
程序员
产品
招聘用人
云端工作
自由工作、远程工作
项目研发
需求梳理
规划落地您的想法
整包开发
一站式软件开发
云服务
UniSMS
合一短信 聚合API短信平台
UniAPI
全类API业务场景
技术
发布需求
开发者入驻
APP
登录
/
注册
全部
开源项目
源文件源码
产品系统
AI
API
电商
运维
游戏
APP
H5网站
PC网站
微信小程序
更多
AI
mPLUG-HiTeA-视频描述-英文-Base
视频描述介绍 视频描述:给定一个视频,模型根据视频信息生成一句对应描述。可以应用于给一张视频配上一句文字或者打个标签的场景。你只需要输入任意一个视频,很快你就能收获对于该视频的描述。 模型描述 本任务
46
0
pytorch
multi-modal
FSMN语音端点检测-中文-通用-16k
FSMN-Monophone VAD 模型介绍 Highlight 16k中文通用VAD模型:可用于检测长语音片段中有效语音的起止时间点。 基于Paraformer-large长音频模型场景的使用
55
0
pytorch
audio
DDColor图像上色
DDColor 图像上色模型 该模型为黑白图像上色模型,输入一张黑白图像,实现端到端的全图上色,返回上色处理后的彩色图像。 English Version | 中文版本 Paper | Github
58
0
pytorch
cv
图像人脸融合
图像人脸融合 给定一张模板图和一张目标用户图,图像人脸融合模型能够自动地将用户图中的人脸融合到模板人脸图像中,生成一张与目标人脸相似,且具有模版图外貌特征的新图像。 其生成效果如下所示: 模型描述
46
0
pytorch
cv
实时口罩检测-通用
实时口罩检测-通用 模型介绍 本模型为高性能热门应用系列检测模型中的 实时口罩检测模型,基于面向工业落地的高性能检测框架DAMOYOLO,其精度和速度超越当前经典的YOLO系列方法。用户使用的时候,
61
0
pytorch
cv
语音合成-广东粤语-通用领域-16k-发音人jiajia
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
59
0
pytorch
audio
Paraformer语音识别-中文-通用-16k-离线-large-pytorch
Paraformer-large模型介绍 Highlights 热词版本:Paraformer-large热词版模型支持热词定制功能,基于提供的热词列表进行激励增强,提升热词的召回率和准确率。 长音
51
0
pytorch
audio
M2FP多人人体解析
M2FP多人人体解析模型介绍 模型描述 M2FP(Mask2Former for Parsing,官方代码)基于 Mask2Former 架构,并进行了一些改进以适应人体解析。 M2FP 可以适应几乎
43
0
pytorch
cv
CoROM文本向量-中文-电商领域-base
coROM中文电商文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大
49
0
pytorch
nlp
FSMN语音端点检测-中文-通用-8k
FSMN-Monophone VAD 模型介绍 Highlight 8k中文通用VAD模型:可用于检测长语音片段中有效语音的起止时间点。 基于Paraformer-large长音频模型场景的使用 基
165
0
pytorch
audio
人脸质量模型FQA
FQA人脸质量评估模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸属性识别、表情识别。 FQA人脸质量评估模型 模型描述 FQA模型包含3个方面的创新, rank映射, Ordinal
85
0
pytorch
cv
语音合成-上海话-通用领域-16k-发音人xiaoda
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
57
0
pytorch
audio
Paraformer语音识别-中文-通用-16k-离线-large-长音频版
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Parformer-l
67
0
pytorch
audio
MossFormer语音分离-单麦-8k
MossFormer语音分离模型介绍 我们日常可能会遇到在嘈杂环境中进行语言交流的场景,比如在人多的餐厅里或者拥挤的人群中,同时存在着许多不同的说话人的声音,这时听者可能只对一个主说话人的声音感兴趣,
46
0
pytorch
audio
语音合成-四川话-通用领域-16k-发音人chuangirl
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
65
0
pytorch
audio
UniASR语音识别-中文-通用-8k-实时-pytorch
Highlights Paraformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型:Paraformer-
45
0
pytorch
audio
BSHM通用抠图
通用抠图介绍 通用抠图对输入图像中的主体进行抠图处理,支持商品、人物、动物、植物、汽车等等,无需任何额外输入,实现端到端通用万物抠图,输出四通道抠图结果,如下图所示: 抠图系列模型
106
0
tensorflow
cv
Paraformer语音识别-中文-通用-16k-离线-large-热词版
Paraformer-large-热词版模型介绍 Highlights Paraformer-large热词版模型支持热词定制功能:实现热词定制化功能,基于提供的热词列表进行激励增强,提升热词的召回率
139
0
pytorch
audio
CT-Transformer标点-中文-通用-pytorch
Controllable Time-delay Transformer模型介绍 Highlights 中文标点通用模型:可用于语音识别模型输出文本的标点预测。 基于Paraformer-large长
84
0
pytorch
audio
StructBERT情绪分类-中文-七分类-base
StructBERT中文情绪分类模型介绍 情绪分类任务,通常为输入一段句子或一段话,识别该句话情绪类别的模型。 在用户评价、观点抽取、意图识别中往往起到重要作用。 模型描述 模型基于Structber
64
0
pytorch
nlp
当前共6711个项目
1
2
3
4
5
6
7
8
9
10
...
登录
登录后即可上传、下载作品
搜索
分类
前端
Qt
Markdown开发包
常用JavaScript包
微信小程序
数据备份
餐饮
iOS/iPhone/iPad开发包
3D图形处理库
Object-c
×
寻找源码
源码描述
联系方式
提交
重点城市程序员兼职推荐
北京程序员兼职
上海程序员兼职
深圳程序员兼职
杭州程序员兼职
广州程序员兼职
成都程序员兼职
南京程序员兼职
武汉程序员兼职
西安程序员兼职
重庆程序员兼职
郑州程序员兼职
长沙程序员兼职
苏州程序员兼职
合肥程序员兼职
厦门程序员兼职
济南 程序员兼职
青岛程序员兼职
天津程序员兼职
大连程序员兼职
福州程序员兼职
石家庄程序员兼职
沈阳程序员兼职
太原程序员兼职
无锡程序员兼职
南昌程序员兼职
哈尔滨程序员兼职
南宁程序员兼职
珠海程序员兼职
宁波程序员兼职
昆明程序员兼职
东莞程序员兼职
贵阳程序员兼职
美国程序员兼职
长春程序员兼职
温州程序员兼职
佛山程序员兼职
常州程序员兼职
呼和浩特程序员兼职
兰州程序员兼职
乌鲁木齐程序员兼职
中山程序员兼职
海口程序员兼职
洛阳程序员兼职
更多
重点岗位程序员兼职推荐
技术创始人兼职
Rust兼职
小程序兼职
cocos2d-x兼职
Unity3D兼职
DBA兼职
运维兼职
测试兼职
移动其他兼职
Go兼职
UE设计师兼职
全栈兼职
Java兼职
CTO兼职
Ruby兼职
C++兼职
PHP兼职
C兼职
C#兼职
Python兼职
架构师兼职
Node.js兼职
Android兼职
iOS兼职
前端兼职
UI设计师兼职
原画师兼职
产品经理兼职
项目经理兼职
区块链兼职
人工智能兼职
硬件开发兼职
更多
您好 👋
我们能提供什么帮助?
向我们发送消息
常见问题、使用帮助、人工咨询等
智能搜索
手机访问
使用微信扫一扫