![](/Public/image/icons/duty.png)
![](/Public/image/icons/location.png)
![](/Public/image/wo/wechat-grey@3x.png)
![](/Public/image/wo/phone-grey@3x.png)
![](/Public/image/icons/lock_2.png)
个人介绍
我是程序员不挽,主要技能有:
编程能力:熟练掌握 Python,C语言,具备良好的编码习惯和代码质量意识
爬虫技术:熟练掌握 Scrapy、Requests、selenium 、playwright 等爬虫框架工具,能够灵活运用。
数据提取优化:熟悉 Xpath ,正则表达式,jsonpath 等提取技术。
数据处理:熟悉 Mongodb的基本语言及使用
大数据集群:了解 hadoop、spark、hive 等分布式集群搭建
有着许多网站的爬虫经验
工作经历
2023-03-13 -2023-07-04数库(上海)科技有限公司数据处理
1.了解数库的数据生产体系; 2.实际上手操作数库开发 DAS 系统来生产财务附注数据; 3.上级分配的其他工作任务; 4.完成上级分配的数据处理工作。
教育经历
2019-09-01 - 2023-06-16常州大学数据科学与大数据技术本科已认证
主修课程: C语言、 数据可视化、 大数据编程、 Python程序设计、 Linux操作系统 1.连续四年担任班级心理委员; 2.在2020-2021年内担任学院青年志愿者协会项目人事部副部长; 3.在2021-2022年内担任学院青年志愿者协会副会长;担任副会长期间组织的志愿活
技能
![playwright爬取京东联盟商品数据](https://filescdn.proginn.com/works_1029435/f183e26d20ba40a0261d1198946409238c0a9383.png!work1)
内容: 该项目是通过playwright进行网页自动爬取京东联盟商品数据 内容: 1、主要利用python爬虫中的pymongo、playwright第三方库进行网页自动化和数据存储爬取 2、分析京东联盟网站的html信息,得到需要的数据所在位置,通过xpath数据提取语法 提取到数据 3、将得到的数据保存到mongodb中 业绩: 本项目通过pymongo、playwright等第三方库进行京东联盟的商品数据爬取,playwright可以实现网页自动化,绕过反爬措施检测。将得到的数据进行保存,以便于后续的数据分析与挖掘。
![](https://stacdn.proginn.com/image/icons/zan_1.png)