bsxy
全职 · 300/日  ·  6525/月
工作时间: 工作日08:30-18:00、周末10:00-17:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

专业技能:

1、熟练掌握Python语言,有百万级数据爬取经验

2、熟悉HTML、XML、JSON等数据格式,能够有效地解析网页数据

3、熟练使用Scrapy、BeautifulSoup等Python爬虫框架,能够编写高效、可靠的爬虫程序

4、针对不同反爬虫级别网站能够做出不同部署,如:批量IP代理池、伪造User-Agent、Cookies免登陆、并发爬取等

5、熟悉前端代码,能够使用代理IP测试出网站的反爬虫机制并检查是否有投毒数据

6、熟练使用Selenium进行Web应用的自动化测试,能够编写高效、可靠的自动化测试脚本。

7、熟悉Pytest等Python测试框架,能够编写和执行测试用例

8、熟练使用Git进行版本控制

工作经历

  • 2023-12-01 -2024-02-03杭州乐布智能科技有限公司软件工程师

    1、数据采集系统开发与维护:负责使用Python和Scrapy框架,参与公司数据采集系统的核心开发,确保其稳定运行. 2、爬虫项目设计与实现:设计并实现多个针对新闻网站、社交媒体及电子商务平台的定制化爬虫项目,实现高效数据抓取。 3、反爬虫策略应对:成功处理多种反爬虫机制,包括动态页面抓取、登录流程模拟、IP代理池管理等,确保爬虫项目的稳定运行。 4、性能优化与数据质量保障:通过技术优化提升数据抓取速度和效率,同时确保抓取数据的准确性和完整性,为业务决策提供高质量数据支持。

教育经历

  • 2020-09-01 - 2024-06-13盐城师范学院数据科学与大数据技术本科

技能

Django
MySQL
前端
0
1
2
3
4
5
0
1
2
3
4
5
作品
基于Django的本地文字存储站点

项目分为展示、添加、删除、查询四个模块,对应内容的添加删除操作皆可在网页端完成且能够做到及时反馈(即删完立马消失)

0
2023-06-27 19:46
爬虫编写

此部分代码能自动从目标网址爬取一整页的表情包并下载到本地,能够便于表情包收集爱好者省时省力地收集大量表情包

0
2023-06-27 19:36
音乐下载器

利用爬虫爬取搜索框内键入歌名或歌手对应的曲目信息并展示在列表框内,再通过点击需要下载的版本实现歌曲、专辑图片、歌词的同时下载。

0
2023-06-27 19:26
更新于: 08-14 浏览: 33