新浪新闻数据分析

我要开发同款
46阅读
开发技术自然语言处理mysql爬虫、python
所属分类大数据

作品详情

在最近三周时间里,我分别收集了发布于新浪网站的国内(Domestic News)与国际新闻(International News)。针对每条新闻,我都一一记录了新闻的标题,发布时间,来源及新闻报道的正文,并将相关数据存储于MySQL数据库中,以供后期数据查询与分析。之后依据收集到的新闻数据,进行数据格式清洗,冗余数据剔除等数据预处理步骤。接下来分析了新闻发布日期、发布时刻、新闻来源的分布情况,最后制作了新闻标题的词云分布图。通过对比国内与国际新闻分布情况的差异,分析隐藏在数据背后的统计规律与现象。 
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论