hcb1256
1月前来过
全职 · 400/日  ·  8700/月
工作时间: 工作日08:00-18:30、周末08:00-16:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是爬虫方面的程序员

工作经历

  • 2022-08-01 -2022-08-12阿里巴巴爬虫程序员

    爬取公司里的相关需要的资料,实习了一段时间,有时候需要一些外网的资料我们也会去爬取对应的字段

教育经历

  • 2009-07-07 - 2021-07-08上海中侨职业技术学院计算机应用技术专科

技能

0
1
2
3
4
5
作品
月票网站爬取

他的网站的月票数是通过特殊加密的,所以直接爬取是不行的,要先把他的加密woff文件先爬取下来保存到本地,然后把里面的映射表拿出来,一一对应上去,然后最后把我们的月票加密字体对应输出出来就能拿到数据了

0
2023-04-20 14:30
requests库

需要使用到js逆向的内容,他的数据包里面是群看不懂的英文加字母,这其实就是我们要的数据,但是得找到他的js加密文件,并把他扣下来到我们的本地运行,对这群英文数字进行解密才能拿到我们的数据。

0
2023-04-20 14:32
scrapy框架,requests库

用scrapy框架爬取京东的书籍,我使用擅长的scrapy_redis的分布式爬虫,非常方便,多节点爬取,速度非常之快,然后我也有使用我的代理ip,防止被封禁ip,最后可以将几万数据很快保存下来,而且可以选择自己的保存方式

0
2023-04-20 14:33
更新于: 2022-08-27 浏览: 171