1.选一个自己感兴趣的主题。2.网络上爬取相关的数据。3.进行文本分析,生成词云。4.对文本分析结果解释说明。预期是首先完成的爬取所有科幻片的演员的名字,然后分析出哪些演员的频率高,得知他在该网站的电影中的热门程度分析网站,看的电影的标题和连接放在标签里面的标签里,主要看代码部分的解释爬取内容保存到数据库代码import requests由于标签里 的连接只是后面那部分,所以使用了一条循环,补全链接for names in soup.select('dl'): name = names.select('a')[0]['href'] addname = "http://www.80dyy.cc{}".format(name) 提取内容到数据库的代码
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论