TextGrocery 短文本分类工具开源项目

我要开发同款
匿名用户2015年01月05日
57阅读
开发技术C/C++
所属分类程序开发、中文分词库
授权协议GPL

作品详情

TextGrocery是一个基于SVM算法的短文本分类工具,内置了结巴分词,让文本分类变得简单。

示例代码:

>>>fromtgroceryimportGrocery#新开张一个杂货铺,别忘了取名!>>>grocery=Grocery('sample')#训练文本可以用列表传入>>>train_src=[('education','名师指导托福语法技巧:名词的复数形式'),('education','中国高考成绩海外认可是“狼来了”吗?'),('sports','图文:法网孟菲尔斯苦战进16强孟菲尔斯怒吼'),('sports','四川丹棱举行全国长距登山挑战赛近万人参与')]>>>grocery.train(train_src)#也可以用文件传入>>>grocery.train('train_ch.txt')#保存模型>>>grocery.save()#加载模型(名字和保存的一样)>>>new_grocery=Grocery('sample')>>>new_grocery.load()#预测>>>new_grocery.predict('考生必读:新托福写作考试评分标准')education#测试>>>test_src=[('education','福建春季公务员考试报名18日截止2月6日考试'),('sports','意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜'),]>>>new_grocery.test(test_src)#准确率0.5#同样可以用文本传入>>>new_grocery.test('test_ch.txt')#自定义分词器>>>custom_grocery=Grocery('custom',custom_tokenize=list)
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论