使用TextCNN对清华大学的新闻预料进行分类。由于硬件限制,只能对一个小型的数据集进行分类,首先对数据进行拆分,通过取出每个类别中的5000条数据构建一个小型的语料库,取其中的65%作为训练集,剩下的作为测试集,并将这65%的训练数据每个分类中的文本全部存放到一个文本中,测试数据也是如此。训练结束后在测试集上的准确率可达85%。
评论