起风了ing
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 周末9:00-23:30工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是一名熟练的爬虫工程师,我善于使用python语言进行爬虫开发,能够独立完成从需求分析到数据处理的整个流程,具有较强的学习能力和团队合作能力,能够快速适应新的技术和项目。
1.
熟悉Python 语言,掌握 python 的基本用法;
2.熟悉一些网络请求模块:requests、httpx、 aiohttp 等;
3. 熟悉一些数据解析模块:xpath、jsonpath、re、css 以及pyquery等;
4. 熟悉使用任务多线程、多进程以及协程,如:threading、multiprocessing 、asyncio 等模块来提高爬虫的效率;
5. 熟悉scrapy 爬虫框架、scrapy-redis 分布式爬虫,额外了解 pyspider、feapder 等主流爬虫
框架;
6.熟悉一些自动化测试工具:selenium、pypepteer、playwright. appium 等;
熟悉一些中间代理抓包 工具:fiddler、charles、mitmproxy 等;
8.熟悉一些数据库的基本操作:mysql、mongodb、redis、 elasticsearch 等,熟悉rabbitma
消息队列的使用;
9.熟悉常用监控工具,如 prometheus、grafana 来监控爬虫状态;
10. 熟悉自动化模拟登录、过一些验证码以及代理池、cookie 池的搭建;
11. 熟悉linux 的常用命令完成日常维护工作,熟悉 docker 以及k8s 集群的搭建和相关部署;
12. 熟悉敏捷开发来使用git 来完成代码仓库管理;
13. 熟悉chatgpt 的相关调用;
14.了解前端方面的知识,如html xml. css、 js 等:
15. 了解一些加密方法,如对称加密(AES、DES 等)、非对称加密(RSA)、摘要签名算法(MD5、SHA 等)以及常见编码算法 BASE64,可以js调试逆向出加密的逻辑。

工作经历

  • 2022-10-01 -至今杭州超级星选网络科技有限公司爬虫

    2022.10-2023.6 抖音精选联盟产品排行榜 爬虫 项目描述: 负费爬取抖音精选选品广场选品库排行榜,找到包之后,通过翻页调试发现请求参数里 msToken 和a_bogus是加密旦变动的,然后通过 js 逆向模拟出动态的值,拿到完整请求参数后对网站进行发送请求,先获取到首页里每个产品的 id,然后拼接 ur,获取到详情页面并对详情页 url发送请求,然后爬取详情页的产品标题,图片***价格,佣金、销量、评分等数据,并存储到 mysql数据库。

  • 2022-10-01 -至今杭州超级星选网络科技有限公司爬虫

    2022.10-2023.6 红人点集网站数据 爬虫 项目介绍:编写爬虫程序,制定 js逆向策路,数据提取、分表存储。 技术选型:Scrapxjs逆向、MySQL 项目描述:分析目标网站真实 requests 地址和response 内容,使用 js 逆向实现逆向登录,还原 sign 请求签名,访问网页内容并爬取,数量大使用 Scrapy 框架,通过 xpath、正则提取有效信息,将数据保存为 CSV 文件,实现可视化。 实现了该网站主播查询、产品查询、价格查询、直播数据查询、数据对比等,并存入 MySQL 数据库中。

教育经历

  • 2011-09-01 - 2014-06-01临泉县第二高级中学计算机科学与技术高中

    大专在学,学信网可查,学校名:浙江杭州开放大学,目前还没毕业,学的是计算机专业,在杭州

技能

多线程
加密解密
爬虫
0
1
2
3
4
5
0
1
2
3
4
5
作品
Piaget伯爵珠宝

Piaget伯爵珠宝网站,负责产品信息的爬取和入库,使用多线程爬取所有产品信息,并分表存储。使用到了正则解析,json字符串转换,

0
2023-07-22 16:22
红人点集

项目介绍:编写爬虫程序,制定js逆向策路,数据提取、分表存储。 技术选型:Scrapy、is逆向、MysQL 项目描述:分析目标网站真实requests 地址和response 内容,使用 js 逆向实现逆向登录,还原 sign 请求签名,访问网页内容并爬取,数量大使用 Scrapy 框架,通过 xpath、正则提取有效信息,将数据保存为 csV 文件,实现可视化,实现了该网站主播查询、产品查询、价格查询、直播数据查询、数据对比等,并存入 MySQL 数据库中。

0
2023-07-22 16:16
抖音精选联盟产品榜

项目描述: 负责爬取抖音精选选品广场选品库排行榜,找到包之后,通过翻页调试发现请求参数里 msToken 和a_bogus是加密旦变动的,然后通过 js 逆向模拟出动态的值,拿到完整请求参数后对网站进行发送请求,先获取到首页里每个产品的 id,然后拼接 url,获取到详情页面并对详情页 url发送请求,然后肥取详情页的产品标题,图片地址,联系方式,产品价格,佣金、销量、评分等数据,井存储到 mysq数据库。

0
2023-07-22 11:51
更新于: 2023-07-22 浏览: 154