点击空白处退出提示
作品详情
1. 自动化爬取某大型旅游网站的景点数据,包括图片、位置、介绍、开关门时间、评论等等,总共数万条。
2. 对数据进行校验、清理、存储、定期更新。
采用技术:
1. JS脱壳、反混淆、反反爬
2. 伪造请求,CSRF
3. python, mysql, sqlite, 多线程
编写爬虫的全部代码;测试,运行以及部署。最终成功获得了两万条数据,包含景点的评论、介绍、经纬度、图片链接、开关门时间等等。部分数据涉及敏感信息,不予展示。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论