1. 采用 requests实现爬取。 2. 用 xpath 提取想要的节点,以列表形式存储。 3. 根据分析出下一页的链接规则,运用re去获取数字,添加到url中继续爬取,下一页面直到获取不到。 4. 把爬取的内容存入本地磁盘,excel,也可存入数据库。
评论