个人介绍
我是程序员不挽,主要技能有:
编程能力:熟练掌握 Python,C语言,具备良好的编码习惯和代码质量意识
爬虫技术:熟练掌握 Scrapy、Requests、selenium 、playwright 等爬虫框架工具,能够灵活运用。
数据提取优化:熟悉 Xpath ,正则表达式,jsonpath 等提取技术。
数据处理:熟悉 Mongodb的基本语言及使用
大数据集群:了解 hadoop、spark、hive 等分布式集群搭建
有着许多网站的爬虫经验
工作经历
和TA聊聊APP扫码和程序员直接沟通
该用户选择隐藏工作经历信息,如需查看详细信息,可点击右上角“和TA聊一聊”查看
教育经历
2019-09-01 - 2023-06-16常州大学数据科学与大数据技术本科已认证
主修课程: C语言、 数据可视化、 大数据编程、 Python程序设计、 Linux操作系统 1.连续四年担任班级心理委员; 2.在2020-2021年内担任学院青年志愿者协会项目人事部副部长; 3.在2021-2022年内担任学院青年志愿者协会副会长;担任副会长期间组织的志愿活
资质认证
技能
内容: 该项目是通过playwright进行网页自动爬取京东联盟商品数据 内容: 1、主要利用python爬虫中的pymongo、playwright第三方库进行网页自动化和数据存储爬取 2、分析京东联盟网站的html信息,得到需要的数据所在位置,通过xpath数据提取语法 提取到数据 3、将得到的数据保存到mongodb中 业绩: 本项目通过pymongo、playwright等第三方库进行京东联盟的商品数据爬取,playwright可以实现网页自动化,绕过反爬措施检测。将得到的数据进行保存,以便于后续的数据分析与挖掘。