项目分为:1、账号登陆 2、数据爬取 3、数据清洗 、4、数据显示 其中由于网站采用js加密,所以采用selenium技术来进行模拟登陆,数据爬取采用了requests库,来进行post请求,在数据清洗中采用re库+正则表达式来进行数据的筛选,最后讲数据整理成想要的格式输出打印,还为其制作了一个图形化界面,作品中还为其添加了查询本机当地的天气,先是爬取查询外网ip的网站获取ip,然后通过api接口调用ip本地天气,返回json格式,然后对其进行数据清理打印
评论