使用爬虫抽取京东的商品信息,首先导入应用库。由于我是使用的selenium库,模仿人工点击不会轻易造成封IP等再加上time.sleep进行休眠,所带的影响会更加的小,让代码也能在甲方的电脑上也能正常运行如飞。其次再根据xpath来抽取甲方想要的信息也相对的方便,可以跳过任意层级。最后将网页里的信息保存到数据库,方便导出。
评论