datacon黑色产业方向优胜奖,主要步骤:使用scrapy爬取网页信息、使用gensimLda进行无监督分类,对生成的topic自动调参,根据topic得到预测结果。根据成绩反馈,80%的数据得到了60%的分数,准确率在75%左右。由于处理速度和爬取速度等原因,最终使用和上传的使用到了80%的数据。
评论