Dagli Java 机器学习函数库开源项目

我要开发同款
匿名用户2020年11月16日
36阅读
开发技术Java
所属分类人工智能、机器学习/深度学习
授权协议BSD-2

作品详情

Dagli是LinkedIn开源的用于Java(和其他JVM语言)的机器学习函数库,其开发团队表示通过它可轻松编写不易出错、可读、可修改、可维护且易于部署的模型管道,而不会引起技术债。Dagli充分利用了现代多核的CPU和功能日益强大的GPU,可以对真实世界模型进行有效的单机训练。

下面是一个文本分类器的介绍性示例,此文本分类器以管道的形式实现,使用梯度增强决策树模型(XGBoost)的主动学习以及高维ngram集作为逻辑回归分类器中的特征:

Placeholder<String>text=newPlaceholder<>();Placeholder<LabelType>label=newPlaceholder<>();Tokenstokens=newTokens().withInput(text);NgramVectorunigramFeatures=newNgramVector().withMaxSize(1).withInput(tokens);Producer<Vector>leafFeatures=newXGBoostClassification<>().withFeaturesInput(unigramFeatures).withLabelInput(label).asLeafFeatures();NgramVectorngramFeatures=newNgramVector().withMaxSize(3).withInput(tokens);LiblinearClassification<LabelType>prediction=newLiblinearClassification<LabelType>().withFeaturesInput().fromVectors(ngramFeatures,leafFeatures).withLabelInput(label);DAG2x1.Prepared<String,LabelType,DiscreteDistribution<LabelType>>trainedModel=DAG.withPlaceholders(text,label).withOutput(prediction).prepare(textList,labelList);LabelTypepredictedLabel=trainedModel.apply("Sometextforwhichtopredictalabel",null);//trainedModelnowcanbeserializedandlaterloadedonaserver,inaCLIapp,inaHiveUDF...
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论