基于ocr识别的简历分析

我要开发同款
派大森2023年04月07日
372阅读
开发技术python

作品详情

项目实现功能:用户在oa小程序上传简历文件,将其转换为base64文件传给后端处理,后端调用paddle_ocr接口对其进行文字识别,对识别的结果进行拼接,然后根据正则和自定义字典分析文本,得出分析结果,包括:简历作者基础资料(姓名、性别、学历、求职目标等)、项目经历(提取成每一条具体的经历,包括项目名称、技术栈、项目内容等)、工作经历(提取成每一天具体的经历,包括公司名称、就职时间、工作岗位等)、自我评价、其他。
项目难点:模块划分时规则不明确,需浏览大量简历总结匹配规则;简历版式多样,左右分布的简历版式难以分辨。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论