Prose Go Go 语言文本处理库开源项目

我要开发同款
匿名用户2017年09月25日
92阅读
开发技术GO语言
所属分类Google Go、文档/文本编辑、应用工具
授权协议MIT

作品详情

Prose是一款用于Go语言的文本处理库(主要是英文),支持okenization(分词)、part-of-speechtagging(词性标注)、named-entityextraction(命名实体提取)等。 

安装$ go get github.com/jdkato/prose/...使用

Tokenizing

Tagging

Transforming

Summarizing

Chunking

License

Tokenizing

单词、句子和regexptokenizer可用。每个分词器实现相同的接口,这样可以轻松地在库的其他部分中自定义词语切分。

package mainimport (    "fmt"    "github.com/jdkato/prose/tokenize")func main() {    text := "They'll save and invest more."    tokenizer := tokenize.NewTreebankWordTokenizer()    for _, word := range tokenizer.Tokenize(text) {        // [They 'll save and invest more .]        fmt.Println(word)    }}
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论