MindOCR OCR 开发及应用工具箱开源项目

我要开发同款
匿名用户2023年03月30日
130阅读
开发技术Python
所属分类人工智能、机器学习/深度学习
授权协议Apache-2.0

作品详情

MindOCR是一个基于 MindSpore 框架的OCR开发及应用的开源工具箱,可以帮助用户训练、应用业界最有优的文本检测、文本识别模型,例如DBNet/DBNet++和CRNN/SVTR,以实现图像文本理解的需求。

主要特性:模块化设计:MindOCR将OCR任务解耦成多个可配置模块,用户只需修改几行代码,就可以轻松地在定制化的数据和模型上配置训练、评估的全流程;高性能:MindOCR提供的预训练权重和训练方法可以使其达到OCR任务上具有竞争力的表现;易用性:MindOCR提供易用工具帮助在真实世界数据中进行文本的检测和识别(敬请期待)。支持模型及性能文本检测

下表是目前支持的文本检测模型和它们在ICDAR2015测试数据集上的精度数据:

模型骨干网络预训练RecallPrecisionF-score配置文件DBNetResNet-50ImageNet81.97%86.05%83.96%YAMLDBNet++ResNet-50ImageNet82.02%87.38%84.62%YAML文本识别

下表是目前支持的文本识别模型和它们在公开测评数据集(IIIT,SVT,IC03,IC13,IC15,SVTP,CUTE)上的精度数据:

模型骨干网络平均准确率配置文件CRNNVGG782.03%YAMLCRNNResnet34_vd84.45%YAML
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论