MindOCR是一个基于 MindSpore 框架的OCR开发及应用的开源工具箱,可以帮助用户训练、应用业界最有优的文本检测、文本识别模型,例如DBNet/DBNet++和CRNN/SVTR,以实现图像文本理解的需求。
主要特性:模块化设计:MindOCR将OCR任务解耦成多个可配置模块,用户只需修改几行代码,就可以轻松地在定制化的数据和模型上配置训练、评估的全流程;高性能:MindOCR提供的预训练权重和训练方法可以使其达到OCR任务上具有竞争力的表现;易用性:MindOCR提供易用工具帮助在真实世界数据中进行文本的检测和识别(敬请期待)。支持模型及性能文本检测下表是目前支持的文本检测模型和它们在ICDAR2015测试数据集上的精度数据:模型骨干网络预训练RecallPrecisionF-score配置文件DBNetResNet-50ImageNet81.97%86.05%83.96%YAMLDBNet++ResNet-50ImageNet82.02%87.38%84.62%YAML文本识别下表是目前支持的文本识别模型和它们在公开测评数据集(IIIT,SVT,IC03,IC13,IC15,SVTP,CUTE)上的精度数据:模型骨干网络平均准确率配置文件CRNNVGG782.03%YAMLCRNNResnet34_vd84.45%YAML点击空白处退出提示
评论