马蜂窝信息采集

我要开发同款
XuLu2023年02月27日
112阅读
开发技术python
所属分类selenium、pandas、爬虫

作品详情

马蜂窝全名是马蜂窝旅游,是中国领先的自由行服务平台。覆盖国内外众多目的地攻略、游记、问答和点评等用户真实分享的信息,并提供酒店、交通和当地游等多种旅行产品。截止当前,注册用户约有5000万,日活约160万。大量优质的用户原创旅游攻略以及海量的个人旅游数据,一直是它的优势所在。因此,对于马蜂窝信息的采集显得尤为重要。运用requests库爬取景点的前100页评论信息,使信息更加集中化。运用selenium自动化技术爬取“四川推荐行程”的指定字段,使信息更加立体化。最终的采集信息显示出某些信息为无效信息亦或者为虚假点评的用户,可能遭遇非法攻击,提前加大内部整改问题的力度以维护自身的权益。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论