Tencent ML-Images 大规模多标签图像数据集开源项目

我要开发同款
匿名用户2018年10月17日
31阅读
开发技术Python
所属分类图形/图像处理、程序开发、机器学习/深度学习
授权协议Apache

作品详情

TencentML-Images 由多标签图像数据集ML-Images与业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。

ML-Images:最大的开源多标签图像数据库,包括17,609,752个训练集和88,739个验证图像URL,最多可标注 11,166个类别。

Resnet-101model:在ML-Images上进行了预训练,并通过迁移学习在ImageNet上实现了top-1精度80.73%。

该项目的主要内容包括:

ML-Images数据集的全部图像URL,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和URL自行下载图像。

ML-Images数据集的详细介绍,包括图像来源、图像数量、类别数量、类别的语义标签体系,标注方法,以及图像的标注数量等统计量。

完整的代码和模型。提供的代码涵盖从图像下载,图像预处理,基于ML-Images的预训练,基于ImageNet的迁移学习,到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论