首页
程序员
产品
招聘用人
云端工作
自由工作、远程工作
项目研发
需求梳理
规划落地您的想法
整包开发
一站式软件开发
云服务
UniSMS
合一短信 聚合API短信平台
UniAPI
全类API业务场景
技术
发布需求
开发者入驻
APP
登录
/
注册
全部
开源项目
源文件源码
产品系统
AI
API
电商
运维
游戏
APP
H5网站
PC网站
微信小程序
更多
pytorch
语音合成-中文-通用领域-16k-发音人zhida
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
25
0
pytorch
audio
OFA文字识别-中文-日常场景-base
OFA-文字识别 News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年12月: 上线创空间:OFA的中文OCR体验
32
0
pytorch
multi-modal
OFA文字识别-中文-通用场景-base
OFA-文字识别 News 2023年1月: 优化了finetune流程,支持参数更新、自定义数据及脚本分布式训练等,见finetune示例。 2022年11月: 发布ModelScope 1.0版
32
0
pytorch
multi-modal
emotion2vec情感通用表征模型base
EMOTION2VEC emotion2vec通用语音情感表征模型 emotion2vec: Self-Supervised Pre-Training for S
33
0
pytorch
中文StableDiffusion-通用领域
中文StableDiffusion-文本生成图像-通用领域 中文Stable Diffusion文生图模型, 输入描述文本,返回符合文本描述的2D图像。 模型描述 本模型采用的是Stable Dif
33
0
pytorch
multi-modal
StyleGAN2人脸生成
人像图片生成介绍 输入随机种子,基于StyleGAN2人像生成模型,返回高清晰(分辨率为1024x1024)的人像图片。 模型描述 StyleGAN是图像生成领域的代表性工作,StyleGAN2在St
25
0
pytorch
cv
RaNER命名实体识别-中文-小说领域-base
RANER介绍 What's New 2022年12月: 训练所使用的序列理解统一框架AdaSeq发布,提供30+ SOTA的复现代码! RaNER家族模型均可在链接进行访问!所使用的NER数据集均
38
0
pytorch
nlp
百川2-13B-对话模型-4bits量化版
Baichuan 2 ?GitHub | ?WeChat ? 百川大模型在线对话平台 已正式向公众开放 ? 目录 ? 模型介绍 ⚙️ 快速开始 ? Benchmark评估 ?
32
0
pytorch
DeepLPF图像调色
DeepLPF: Deep Local Parametric Filters for Image Enhancement 模型描述 该模型为图像色彩增强模型,输入为待调色的图像,输出为增强后的图像。D
31
0
pytorch
cv
RaNER命名实体识别-中文-通用领域-base
RANER介绍 模型描述 本方法采用Transformer-CRF模型,使用StructBERT作为预训练模型底座,结合使用外部工具召回的相关句子作为额外上下文,使用Multi-view Traini
32
0
pytorch
nlp
读光-表格结构识别-无线表格
LORE无线表格结构识别模型介绍 表格结构识别,即给定一张图片,检测出图中单元格的物理坐标(四个顶点)以及逻辑坐标(行号列号)。在无线表格中,单元格的物理坐标使用表格内文字的外接框。 模型描述 本模型
40
0
pytorch
cv
异常图像检测
Bad Image Detecting 模型描述 基于mobilenet-v2的一个简单基线,可以有效检测异常图像,包括编解码或者图像宽高、行偏移错误等造成的花屏,绿屏图像。 Bad
24
0
pytorch
cv
Image-to-Video高清图像生成视频大模型
Image-to-Video高清图像生成视频大模型 本项目Image-to-Video旨在解决根据输入图像生成高清视频任务。Image-to-Video由达摩院研发的高清视频生成基础模型之一,其核心部
31
0
pytorch
multi-modal
MFCCA多通道多说话人语音识别-中文-AliMeeting-16k-离线
MFCCA多说话人语音识别模型介绍 Highlights 本模型主要是解决会议场景下多说话人语音识别的问题,基于ICASSP2022 M2MeT竞赛发布的真实会议场景语料库AliMeeting进行训练
26
0
pytorch
audio
Paraformer语音识别-中文-通用-16k-实时-pytorch
Highlights Paraformer 模型是一种非自回归(Non-autoregressive)端到端语音识别模型。非自回归模型相比于自回归模型,可以对整条句子并行输出目标文字,具有更高的计算效
32
0
pytorch
audio
CLIP模型-中文-通用领域-base
中文CLIP News 2022年11月: 发布ModelScope 1.0版本,以下能力请使用1.0.2及以上版本。 上线Huge模型(224分辨率) 上线创空间,更强大的demo展示:中文图文检
31
0
pytorch
multi-modal
口罩人脸识别模型FaceMask
FaceMask 模型介绍 稳定调用及效果更好的API,详见视觉开放智能平台:人脸比对1:1、口罩人脸比对1:1、人脸搜索1:N、公众人物识别、明星识别。 口罩人脸识别模型FaceMask, 推荐使用
24
0
pytorch
cv
YOLOX-PAI手部检测模型
手部检测模型 输入一张图像,并对其中手部区域进行检测,输出所有手部区域检测框、置信度和标签。 模型描述 该模型主要用于手部检测任务,从图像中检测出人手框坐标、置信度和标签。该任务使用阿里云PAI-Ea
33
0
pytorch
cv
StructBERT情感分类-中文-电商-base
StructBERT中文情感分类模型介绍 情感分类任务,通常为输入一段句子或一段话,返回该段话正向/负向的情感极性,在用户评价,观点抽取,意图识别中往往起到重要作用。而在电商场景中,情感分类显得尤为重
29
0
pytorch
nlp
语音合成-中文-通用领域-16k-发音人ainan
Sambert-Hifigan模型介绍 框架描述 拼接法和参数法是两种Text-To-Speech(TTS)技术路线。近年来参数TTS系统获得了广泛的应用,故此处仅涉及参数法。 参数TTS系统可分为两
28
0
pytorch
audio
当前共5187个项目
1
2
3
4
5
6
7
8
9
10
...
登录
登录后即可上传、下载作品
搜索
分类
VR/AR
3C
Sliverlight
数据库服务器
ActionScript
Activity
html
jQuery分页插件
后台管理
系统监控
×
寻找源码
源码描述
联系方式
提交
重点城市程序员兼职推荐
北京程序员兼职
上海程序员兼职
深圳程序员兼职
杭州程序员兼职
广州程序员兼职
成都程序员兼职
南京程序员兼职
武汉程序员兼职
西安程序员兼职
重庆程序员兼职
郑州程序员兼职
长沙程序员兼职
苏州程序员兼职
合肥程序员兼职
厦门程序员兼职
济南 程序员兼职
青岛程序员兼职
天津程序员兼职
大连程序员兼职
福州程序员兼职
石家庄程序员兼职
沈阳程序员兼职
太原程序员兼职
无锡程序员兼职
南昌程序员兼职
哈尔滨程序员兼职
南宁程序员兼职
珠海程序员兼职
宁波程序员兼职
昆明程序员兼职
东莞程序员兼职
贵阳程序员兼职
美国程序员兼职
长春程序员兼职
温州程序员兼职
佛山程序员兼职
常州程序员兼职
呼和浩特程序员兼职
兰州程序员兼职
乌鲁木齐程序员兼职
中山程序员兼职
海口程序员兼职
洛阳程序员兼职
更多
重点岗位程序员兼职推荐
技术创始人兼职
Rust兼职
小程序兼职
cocos2d-x兼职
Unity3D兼职
DBA兼职
运维兼职
测试兼职
移动其他兼职
Go兼职
UE设计师兼职
全栈兼职
Java兼职
CTO兼职
Ruby兼职
C++兼职
PHP兼职
C兼职
C#兼职
Python兼职
架构师兼职
Node.js兼职
Android兼职
iOS兼职
前端兼职
UI设计师兼职
原画师兼职
产品经理兼职
项目经理兼职
区块链兼职
人工智能兼职
硬件开发兼职
更多
您好 👋
我们能提供什么帮助?
向我们发送消息
常见问题、使用帮助、人工咨询等
智能搜索
手机访问
使用微信扫一扫