匿名用户2014年04月09日
96阅读
开发技术C/C++
所属分类NASA开源项目、其他开源、NASA 开源项目
授权协议NOSA

作品详情

IND是一个开源的系统,可以处理大部分的独立事件,而这些独立事件都是使用固定长度的向量描述的值。IND提供了一系列的功能特征和使用风格,主要是为了方便普通用户以及高级用户或者是那些对调查研究感兴趣的人使用。IND是由四个基础的例程组成:数据操作例程、目录生成例程、目录检测例程和目录显示例程。

INDisapplicabletomostdatasetsconsistingofindependentinstances,eachdescribedbyafixedlengthvectorofattributevalues.Anattributevaluemaybeanumber,oneofasetofattributespecificsymbols,oromitted.Oneoftheattributesisdelegatedthe"target"andINDgrowstreestopredictthetarget.Predictioncanthenbedoneonnewdataorthedecisiontreeprintedoutforinspection.

INDprovidesarangeoffeaturesandstyleswithconvenienceforthecasualuseraswellasfine-tuningfortheadvanceduserorthoseinterestedinresearch.INDcanbeoperatedinaBreiman/Friedman/Olshen/Stone-likemode(butwithoutregressiontrees,surrogatesplitsormultivariatesplits),andinamodelikeC4.5.Advancedfeaturesallowmoreextensivesearch,interactivecontrolanddisplayoftreegrowing,andBayesianandMMLalgorithmsfortreepruningandsmoothing.Theseoftenproducemoreaccurateclassprobabilityestimatesattheleaves.

INDalsocomeswithacomprehensiveexperimentalcontrolsuite.INDconsistoffourbasickindsofroutines;datamanipulationroutines,treegenerationroutines,treetestingroutines,andtreedisplayroutines.Thedatamanipulationroutinesareusedtopartitionasinglelargedatasetintosmallertrainingandtestsets.Thegenerationroutinesareusedtobuildclassifiers.Thetestroutinesareusedtoevaluateclassifiersandtoclassifydatausingaclassifier.Andthedisplayroutinesareusedtodisplayclassifiersinvariousformats.

INDiswritteninK&RC,withcontrollingscriptsinthe"csh"shellofUNIX,andextensiveUNIXmanentries.ItisdesignedtobeusedonanyUNIXsystem,althoughithasonlybeenthoroughlytestedonSUNplatforms.INDcomeswithamanualgivingaguidetotreemethods,andpointerstotheliterature,andseveralcompaniondocuments.

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论