1.使用 scrapy 创建爬虫项目编写爬虫代码2.创建 cookie 池,IP 池3.对各个网站历史数据采集,以及定时获取增量获取信息,及时更新现有数据拍卖状态信息4.处理淘宝风控反爬机制,工行融 e 购图片防盗链等破解各个网站反爬策略5.对现有的数据使用 pandas 进行清洗处理,以及使用 pyecharts 进行数据可视化分析处理,项目期间日常的爬虫管理维护
评论