jay777
1月前来过
全职 · 300/日  ·  6525/月
工作时间: 工作日20:00-23:00、周末08:30-23:00工作地点:
服务企业: 11家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

本人大学期间开始学习Python编程、爬虫;

熟悉数据爬取、解析、入库操作;

熟悉常见反爬策略及反反爬技术;

熟悉 Python 中的多线程、多进程以及协程;

熟悉自动化工具Selenium、Pyppeteer、Appium的使用;

熟悉使用Scrapy、Scrapy-redis

工作经历

  • 2021-03-10 -至今成都云览科技有限公司爬虫工程师

    主要负责新闻数据抓取、解析与入库; 根据业务需求,构建 IP 代理池,处理 JS 逆向、验证码等反反爬问题; 负责爬虫程序的日常维护与优化工作; 负责去除网页数据中常见的杂质。

教育经历

  • 2016-03-09 - 2020-03-06西南科技大学计算机科学与技术本科

    大二开始学习python编程,大学期间学过爬虫、机器学习、可视化、前端知识

技能

多线程
MySQL
MongoDB
爬虫
0
1
2
3
4
5
0
1
2
3
4
5
作品
《抖音 app》 用户数据抓取

抓取抖音用户数据。使用 Xposed 框架与 JustTrustme 组件绕过 SSL 证书验证;使用 Appium 模拟滑动用户关注列表,并结合 Mitmdump 获取响应数据并解析

0
2023-05-04 09:46
《网易云音乐》热评抓取

抓取网易云音乐上的热评数据。主要难点是解决参数加密问题。解决方法是通过浏览器自带的抓包工具分析网页源码,JS 逆向找到参数加密规则,并用 Python 实现参数加密

0
2023-05-04 09:48
《猫眼影视》票房数据抓取

抓取猫眼影视近一年的电影票房数据。难点主要是处理该网站的字体反爬。解决方案是使用 FontTools 模块将源码 Woff 格式字体文件转成 Xml 格式文件,找到字体映射关 系,进而替换掉源码相关内容

0
2023-05-04 09:56
更新于: 2022-03-12 浏览: 350