该项目分为数据挖掘和数据处理。数据来源于特定网站的pdf数据,需要处理文档内重要信息的自动提取。实现功能包括提取文档数据、辅助识别数据位置和图片处理、部分自然语言处理、OCR实现、账号功能、pdf数据格式的数据读写、生成exe可执行文件。
评论