jieba.NET 结巴分词 .NET 版开源项目

我要开发同款
匿名用户2015年09月23日
44阅读
开发技术.NET
所属分类程序开发、中文分词库
授权协议MIT

作品详情

jieba.NET是jieba中文分词的.NET版本(C#实现)。当前版本为0.37.1,基于jieba0.37,目标是提供与jieba一致的功能与接口,但以后可能会在jieba基础上提供其它扩展功能。当前主要提供分词、词性标注和关键词提取功能。

特点

支持三种分词模式:

精确模式,试图将句子最精确地切开,适合文本分析;

全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;

搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。

支持繁体分词

支持自定义词典

MIT授权协议

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论