首页
程序员
产品
招聘用人
云端工作
自由工作、远程工作
项目研发
需求梳理
规划落地您的想法
整包开发
一站式软件开发
云服务
UniSMS
合一短信 聚合API短信平台
技术
发布需求
开发者入驻
APP
登录
/
注册
全部
动态
开源项目
源文件源码
产品系统
Java
Python
C/C++
PHP
C#
TypeScript
Go
Swift
更多
视频单目标跟踪-通用领域-L
单目标跟踪算法模型介绍 对于一个输入视频,只需在第一帧图像中用矩形框指定待跟踪目标,单目跟踪算法将在整个视频帧中持续跟踪该目标,输出跟踪目标在所有图像帧中的矩形框信息。 模型描述 本模型是基于OST
49
0
pytorch
cv
语音合成-中文-通用领域-16k-发音人zhiya
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
45
0
pytorch
audio
SPACE预训练对话模型-英文-base
模型背景 2018年,Bert等预训练语言模型的出现,给NLP下游任务带来了普遍的效果提升,成为NLP的一个重要里程碑,但这些预训练语言模型并没有反映对话的特点,比如分角色、多轮次、知识约束、讲对话策
35
0
pytorch
nlp
RaNER-chunking-英文-large
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用XLM-Roberta作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Train
23
0
pytorch
nlp
DAMOYOLO-高性能通用检测模型-M
模型描述 这里我们提供基于业界领先的目标检测框架DAMO-YOLO训练的检测模型:DAMO-YOLO-M。DAMO-YOLO是一个面向工业落地的目标检测框架,兼顾模型速度与精度,其训练的模型效果超越了
25
0
pytorch
cv
CLIP_It自然语言引导的视频摘要-Web视频领域-英文
视频摘要 输入一段长视频和一段文字描述,算法根据用户输入的文字对输入视频中的相关片段进行自适应的视频摘要,根据帧号可以合成一段短视频(摘要视频)。 模型结构: 如上图所示,用户输入的文字使
19
0
pytorch
cv
RaNER命名实体识别-俄语-通用领域-large
RANER介绍 模型描述 该模型是基于检索增强(RaNer)方法在俄语数据集MultiCoNER-RU-Russian训练的模型。 本方法采用Transformer-CRF模型,使用XLM-RoBER
24
0
pytorch
nlp
RaNER命名实体识别-孟加拉语-通用领域-large
RANER介绍 模型描述 该模型是基于检索增强(RaNer)方法在孟加拉语数据集MultiCoNER-BN-Bangla训练的模型。 本方法采用Transformer-CRF模型,使用XLM-RoBE
21
0
pytorch
nlp
Segformer-B1实时语义分割
Segformer-B1语义分割模型介绍 其它相关模型体验Mask2Former-R50全景分割 模型描述 Neurips2021文章SegFormer: Simple and Efficient
31
0
pytorch
cv
UniASR语音识别-俄语-通用-16k-实时
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
33
0
pytorch
audio
UniASR语音识别-韩语-通用-16k-实时
UniASR 模型介绍 FunASR开源项目介绍 FunASR希望在语音识别的学术研究和工业应用之间架起一座桥梁。通过发布工业级语音识别模型的训练和微调,研究人员和开发人员可以更方便地进行语音识别模型
66
0
pytorch
audio
GTE文本向量-英文-通用领域-small
GTE英文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大的推
32
0
pytorch
nlp
GTE文本向量-英文-通用领域-large
GTE英文通用文本表示模型 文本表示是自然语言处理(NLP)领域的核心问题, 其在很多NLP、信息检索的下游任务中发挥着非常重要的作用。近几年, 随着深度学习的发展,尤其是预训练语言模型的出现极大的推
34
0
pytorch
nlp
ERes2Net-Large说话人确认-中文-3D-Speaker-16k
3D-Speaker ERes2Net-Large 说话人识别模型 ERes2Net模型结合全局特征和局部特征,从而提高说话人识别性能。局部特征融合将一个单一残差块内的特征融合提取局部信号;全局特征融
26
0
pytorch
audio
BEiTv2图像分类-通用-base
通用预训练模型介绍 BEiTv2(base模型,在ImageNet-1k上预训练,并在ImageNet-21k上进行微调) BEiTv2模型先在ImageNet-1k(1419万张图像,1000个类别
28
0
pytorch
cv
离散对抗训练ViT-H/14-鲁棒图像分类-imagenet1k
鲁棒图像识别介绍 鲁棒图像识别要求模型在带噪声或分布外图像输入上依然返回正确分类结果。 模型描述 离散对抗训练 (Discrete Adversarial Training, DAT) 是一种针对视觉
28
0
pytorch
cv
语音识别-俄语-后处理- ITN模型
俄语逆文本正则化模型 模型描述 俄语逆文本正则化模型是基于FunTextProcessing 开源代码库生成,用于俄语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本正则化 逆文
38
0
pytorch
audio
语音识别-韩语-后处理- ITN模型
韩语逆文本正则化模型 模型描述 韩语逆文本正则化模型是基于FunTextProcessing开源代码库生成,用于韩语语音识别模型结果后处理中的逆文本正则化部分。 多语言逆文本正则化&文本正则化 逆文本
63
0
pytorch
audio
OFA-MMSpeech语音识别预训练-中文-通用领域-large
注:请使用modelscope==1.2.0以上版本 MMSpeech ASR是什么 ASR(Automatic Speech Recognition)语音识别技术,是一种将人的语音转换为文本的技术
37
0
pytorch
multi-modal
ParaformerBert语音识别-中文-aishell2-16k-离线-pytorch
ParaformerBert模型介绍 ModelScope-FunASR FunASR希望在语音识别方面建立学术研究和工业应用之间的桥梁。通过支持在ModelScope上发布的工业级语音识别模型的训练
34
0
pytorch
audio
当前共161626个项目
...
7990
7991
7992
7993
7994
7995
7996
7997
7998
7999
8000
...
登录
登录后即可上传、下载作品
搜索
分类
爬虫
网页开发工具
物联网
TypeScript
CMS
微服务
HTML/CSS
JavaScript
Kotlin
HTML5开发相关
×
寻找源码
源码描述
联系方式
提交
重点城市程序员兼职推荐
北京程序员兼职
上海程序员兼职
深圳程序员兼职
杭州程序员兼职
广州程序员兼职
成都程序员兼职
南京程序员兼职
武汉程序员兼职
西安程序员兼职
重庆程序员兼职
郑州程序员兼职
长沙程序员兼职
苏州程序员兼职
合肥程序员兼职
厦门程序员兼职
济南 程序员兼职
青岛程序员兼职
天津程序员兼职
大连程序员兼职
福州程序员兼职
石家庄程序员兼职
沈阳程序员兼职
太原程序员兼职
无锡程序员兼职
南昌程序员兼职
哈尔滨程序员兼职
南宁程序员兼职
珠海程序员兼职
宁波程序员兼职
昆明程序员兼职
东莞程序员兼职
贵阳程序员兼职
美国程序员兼职
长春程序员兼职
温州程序员兼职
佛山程序员兼职
常州程序员兼职
呼和浩特程序员兼职
兰州程序员兼职
乌鲁木齐程序员兼职
中山程序员兼职
海口程序员兼职
洛阳程序员兼职
更多
重点岗位程序员兼职推荐
C++兼职
Rust兼职
小程序兼职
cocos2d-x兼职
Unity3D兼职
DBA兼职
运维兼职
测试兼职
移动其他兼职
Go兼职
UE设计师兼职
全栈兼职
技术创始人兼职
CTO兼职
项目经理兼职
产品经理兼职
原画师兼职
UI设计师兼职
前端兼职
iOS兼职
Android兼职
Node.js兼职
Ruby兼职
架构师兼职
Python兼职
C#兼职
C兼职
PHP兼职
Java兼职
鸿蒙兼职
区块链兼职
人工智能兼职
硬件开发兼职
更多
您好 👋
我们能提供什么帮助?
向我们发送消息
常见问题、使用帮助、人工咨询等
智能搜索
手机访问
使用微信扫一扫