Naive Bayesian Classifier 朴素贝叶斯分类器开源项目

我要开发同款
匿名用户2017年10月24日
47阅读
开发技术Python
所属分类人工智能、机器学习/深度学习
授权协议MIT

作品详情

这是一个非常简单的Python库,实现了朴素贝叶斯分类器。

示例代码:

"""Suppose you have some texts of news and know their categories.You want to train a system with this pre-categorized/pre-classified texts. So, you have better call this data your training set."""from naiveBayesClassifier import tokenizerfrom naiveBayesClassifier.trainer import Trainerfrom naiveBayesClassifier.classifier import ClassifiernewsTrainer = Trainer(tokenizer.Tokenizer(stop_words = [], signs_to_remove = ["?!#%&"]))# You need to train the system passing each text one by one to the trainer module.newsSet =[    {'text': 'not to eat too much is not enough to lose weight', 'category': 'health'},    {'text': 'Russia is trying to invade Ukraine', 'category': 'politics'},    {'text': 'do not neglect exercise', 'category': 'health'},    {'text': 'Syria is the main issue, Obama says', 'category': 'politics'},    {'text': 'eat to lose weight', 'category': 'health'},    {'text': 'you should not eat much', 'category': 'health'}]for news in newsSet:    newsTrainer.train(news['text'], news['category'])# When you have sufficient trained data, you are almost done and can start to use# a classifier.newsClassifier = Classifier(newsTrainer.data, tokenizer.Tokenizer(stop_words = [], signs_to_remove = ["?!#%&"]))# Now you have a classifier which can give a try to classifiy text of news whose# category is unknown, yet.unknownInstance = "Even if I eat too much, is not it possible to lose some weight"classification = newsClassifier.classify(unknownInstance)# the classification variable holds the possible categories sorted by # their probablity valueprint classification
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论