白羽-成都Python-程序员客栈

1月前来过

D级

开发

成都

全职 · 500/日 · 10875/月信用正常

工作时间: 工作日20:00-23:00、周末11:00-06:00工作地点: 远程

服务企业: 2家累计提交: 0工时

联系方式:

********

查看联系方式

聊一聊

使用APP扫码聊一聊

去下载APP

个人主页

我是程序员客栈的【暮色】，一名【开发】；

我毕业于【电子科技大学】，担任过【腾讯】的【开发】，担任过【小米】的【数据工程师】

如果我能帮上您的忙，请点击“立即预约”或“发布需求”！

2018-07-01 -2024-03-21腾讯开发
网络爬虫及网站开发经验 Python多进程、多线程、协程技术 Python运行时内存优化技术 Python程序打包成exe的技术高并发、抗反爬的网络爬虫技术（XPATH、Regex正则表达式，数据加密解密、数据提取、数据清洗、数据存储优化、验证码破解、代理池构建等） Web网站后端开发技术（Django、Flask、Mysql、Redis、Nginx、Supervisor） Mysql数据库设计及数据备份、同步、查询优化技术 Redis、MongoDB数据库使用技术 Django、Scrapy的使用技术服务器自动化部署及定时调度技术基于Matlab的图像加密、图像无痕水印技术网络爬虫及网站开发经验 Python多进程、多线程、协程技术 Python运行时内存优化技术 Python程序打包成exe的技术高并发、抗反爬的网络爬虫技术（XPATH、Regex正则表达式，数据加密解密、数据提取、数据清洗、数据存储优化、验证码破解、代理池构建等） Web网站后端开发技术（Django、Flask、Mysql、Redis、Nginx、Supervisor） Mysql数据库设计及数据备份、

2014-09-01 - 2018-06-26电子科技大学电子信息硕士

Python

作品

球探比分网历史数据的获取

Scrapy来爬取球探网的数据:可以爬取球员数据,包括球员名称、年龄、身高、体重、位置、球队，历史比分等信息。通过浏览器开发者工具查看页面元素,确定数据位置,以便后续定位提取。使用requests获取页面:构造请求获取不同位置的球员数据页面。使用BeautifulSoup解析页面:解析页面HTML文档,使用CSS选择器或XPath提取包含目标数据的标签内容。使用正则表达式提取数据:对提取的文本内容使用正则表达式进行解析,获取具体的数据字段。将获取的具体数据库异步存入数据库，以便分析。设计缓存和异常处理机制:使用缓存避免重复爬取,处理各种异常情况如网页解析错误等。使用线程、协程提高爬取效率。