个人介绍
1. 掌握 python 的基础知识,有良好的编码习惯。
2. 熟悉 Scrapy 和 Scrapy-redis 框架,有海量数据爬取经验。
3. 熟悉 pyppeteer、requests、selenium,fiddler、Charles、mtim、appium 获取网络数据信息。
4. 熟悉正则表达式、xpath、lxml 模块提取数据。
5. 熟悉前端 HTML、CSS、JS 页面结构,知晓 web 交互流程及原理。
6. 熟悉网站常见反爬策略,有 ip 池、cookie 池、js 解密、css 解密等经验,能根据网页分析出常见反爬手段。对各类验证码的破解有深刻理解。
7.&nbs***、拼多多、苏宁易购、唯品会、京东等手机 app 的爬取经验
8. 了解逆向工程,能够使用 androidkiller 分析 APP 结构以及 IDA 断点调试分析9.熟练使用 mysql,mongodb,redis,pgsql 有集群搭建和管理经验。
10. 熟练使用 linux,docker、git、Gerapy 版本管理工具11.了解数据分析 Numpy、Pandas 数据处理模块的使用。12.了解后端框架 flask、django、tornado 并编写后端。13.曾参与公司内部爬虫管理系统开发
工作经历
2021-05-16 -至今某科技股份有限公司广州分公司爬虫工程师
-研究目标网页探寻特点和规律,开发数据爬虫,完成数据采集、解析处理及入库; -负责爬虫服务架构的设计和研发,完善现有的爬虫体系; -负责现有爬虫和服务的维护和优化; -参与公司数据采集与分析项目工作; -参与数据采集与分析代码编写、单元测试和 bug 修复工作; -获取、洗、修复、建模、将数据可视化生成报告 -根据产品和项目情况,优化及维护代码; 根据产品开发规范,完成相关技术文档编写;
教育经历
2013-09-01 - 2017-07-01西南财经大学天府学院计算机科学与技术本科