風起丶
全职 · 300/日  ·  6525/月
工作时间: 工作日19:00-22:00、周末10:00-20:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

找我划算

工作经历

  • 2022-03-01 -2024-03-26立昌科技发展有限公司python爬虫工程师

    梳理和解读业务,根据业务需求,提供数据层面的解决方案,进行爬取; 负责系统代码撰写及日常管理工作;

教育经历

  • 2019-09-01 - 2022-06-01河南工业贸易职业学院计算机应用技术专科

技能

HTML5
Node.js
0
1
2
3
4
5
0
1
2
3
4
5
作品
爬取好大夫等医生信息

1、分析网站 ,理解网站的跳转逻辑 ,找到爬虫入口 ,抓取规则 ,入库规则 ,字段定义等内容 ,然后开始python 网络爬虫技术。 2、使用Scrapy框架可以跟简易的完成页面的跳转 ,提高数据的爬取速度。 3、处理访问异常 :数据源异常的网站 ,将出错的网址存入Redis数据库或者MongoDB数据库。标记错误类型 , 之后统一处理。 4、状态码处理:各种状态码 ,将指定异常的状态码存进数据库 ,重新抓取。 5、增量更新 :在数据第一次全量抓取时 ,数据库中标记每条问诊最后一句对话的位置和链接 ,下次抓取直接从 标记好的位置抓取 ,实增量更新。

1
2024-07-09 16:41
更新于: 07-02 浏览: 51