stringmetric Scala 的字符串相似性度量算法库开源项目

我要开发同款
匿名用户2016年03月21日
55阅读
开发技术Scala
所属分类开发工具
授权协议MIT

作品详情

stringmetric是Scala的字符串相似性度量算法的库。(如:Dice/Sorensen,Hamming,Jaccard,Jaro,Jaro-Winkler,Levenshtein,Metaphone,N-Gram,NYSIIS,Overlap,Ratcliff/Obershelp,RefinedNYSIIS,RefinedSoundex,Soundex,WeightedLevenshtein)

这个库提供了一些工具来进行字符串相似度匹配,用来测量字符串的相似性与距离,通过单词的发音和声音的相似性比较来索引,除核心库之外,每个度量和算法都有一个命令行界面。

要求:Scala2.10+

文档:Scaladoc

问题:Enhancements, Questions, Bugs

版本:SemanticVersioningv2.0

依赖

SBT:

libraryDependencies += "com.rockymadden.stringmetric" %% "stringmetric-core" % "0.27.4"

Gradle:

compile 'com.rockymadden.stringmetric:stringmetric-core_2.10:0.27.4'

Maven:

<dependency>    <groupId>com.rockymadden.stringmetric</groupId>    <artifactId>stringmetric-core_2.10</artifactId>    <version>0.27.4</version></dependency>创建CLIs$ git clone https://github.com/rockymadden/stringmetric.git$ cd stringmetric$ sbt clean package$ ./project/build.sh$ ./target/cli/jarometric abc xyz使用CLIs

获取帮助

$ metaphonemetric --helpCompares two strings to determine if they are phonetically similarly, per the Metaphone algorithm.Syntax:  metaphonemetric [Options] string1 string2...Options:  -h, --help    Outputs description, syntax, and options.

获取度量的比较值

$ jarowinklermetric dog dawg0.75

获取差异算法的代表值

$ metaphonealgorithm dogtk
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论