爬取小红书上你想要的 关键词搜所后的文本内容

我要开发同款
proginn21050683482023年11月20日
268阅读
开发技术python
所属分类爬虫

作品详情

使用了selenium,因为小红书的反爬机制很强,所以填了一个stain.js的文件避免被封掉ip
成功登录以后即可为心所欲,在页面爬取时,因为页面的数据是动态加载的,所以我们还需要一些js的操作,每隔5秒自动向下滑动滑轮一定距离,是的数据远远不断的刷新,判断当前页面是否到底,只需要判断当前页面的高度是否有改变,如果一直没变,则说明数据爬取完毕,任务结束
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论