gbdt算法族的高性能实现
gbdt的Python项目详细描述
GBDT是一种高性能和全功能C++实现的[ Jerome H. Friedman的梯度提升决策树算法](http://STATEBET.Stanford .EDU/~JHF/FTP/STOBST.PDF)及其现代子集。它具有高效、低内存占用、丢失函数集合和处理分类特征和丢失值的内置机制。
*-BR/***您正在寻找超越线性模型。**BR/> *梯度提升决策树算法是一种具有非线性转换和特征交叉能力的最佳的ML算法。
** *您的数据太大,无法用现有的ML包加载到内存中。**BR/**GBDT减少内存使用功能bucketization显著地占用空间。对于一些测试数据集,它使用了对应数据集的1/7内存,只花了1/2的时间进行训练。有关更多详细信息,请参见[docs/performance_benchmark.md](https://github.com/yarny/gbdt/blob/master/docs/performance_benchmark.md)。
***您希望更好地处理分类功能和缺少的值。**
*gbdt具有内置机制,以确定如何拆分分类功能并将缺少的值放置在树中。
**尝试不同的损失函数。**
*gbdt实现各种点态、成对、列表式损失函数,包括mse、logloss、huberized hinge loss、成对logloss、
[gbrank](http://www.cc.gatech.edu/~zha/papers/fp086 zheng.pdf)和[lambdamart](https://www.microsoft.com/en-us/research/wp content/uploads/2016/02/msr-tr-2010-82.pdf)。它支持轻松添加您自己的自定义丢失功能。
** *您的数据太大,无法用现有的ML包加载到内存中。**BR/**GBDT减少内存使用功能bucketization显著地占用空间。对于一些测试数据集,它使用了对应数据集的1/7内存,只花了1/2的时间进行训练。有关更多详细信息,请参见[docs/performance_benchmark.md](https://github.com/yarny/gbdt/blob/master/docs/performance_benchmark.md)。
***您希望更好地处理分类功能和缺少的值。**
*gbdt具有内置机制,以确定如何拆分分类功能并将缺少的值放置在树中。
**尝试不同的损失函数。**
*gbdt实现各种点态、成对、列表式损失函数,包括mse、logloss、huberized hinge loss、成对logloss、
[gbrank](http://www.cc.gatech.edu/~zha/papers/fp086 zheng.pdf)和[lambdamart](https://www.microsoft.com/en-us/research/wp content/uploads/2016/02/msr-tr-2010-82.pdf)。它支持轻松添加您自己的自定义丢失功能。