特性:
极易上手,具备完善的文档和示例
支持多并发爬取
支持基于xpath、css选择器解析内容
模拟浏览器行为,如user-agent、cookie、提交表单
支持断点续爬、失败重试、代理、并有完善的爬取日志
健壮的底层库,HTTP客户端基于guzzle,dom解析基于symfony/dom-crawler库
查看文档:https://xcrawler.yanshuju.com/docs/
特性:
极易上手,具备完善的文档和示例
支持多并发爬取
支持基于xpath、css选择器解析内容
模拟浏览器行为,如user-agent、cookie、提交表单
支持断点续爬、失败重试、代理、并有完善的爬取日志
健壮的底层库,HTTP客户端基于guzzle,dom解析基于symfony/dom-crawler库
查看文档:https://xcrawler.yanshuju.com/docs/
评论