XGBoost是"极端梯度提升"(eXtremeGradientBoosting)的简称。XGBoost源于梯度提升框架,但是更加高效,秘诀就在于算法能并行计算、近似建树、对稀疏数据的有效处理以及内存使用优化,这使得XGBoost至少比现有梯度提升实现有至少10倍的速度提升。
XGBoost支持在多台机器上进行分布式训练,包括AWS,GCE,Azure和Yarn集群。可以与Flink,Spark和其他云数据流系统集成。
XGBoost可以处理回归、分类和排序等多种任务。由于它在预测性能上的强大且训练速度快,XGBoost已屡屡斩获Kaggle各大竞赛的冠军宝座。
评论