来自斯坦福大学的glmnet的python版本
glmnet-python的Python项目详细描述
#对于python的glmnet
>b.j.balakumar
>bbalasub@stanford.edu.edu
>韩方
>hanfafafafafang.cshl@gmail.com
pip-install glmnet-py
p-install-glmnet-hub.com/han fang/glmnet_python.git
光盘glmnet_python
python setup.py install
要求:python3,linux
glmnet.so的签入版本是为以下配置编译的:
**Linux:*Linux版本2.6.32-573.26.1.el6.x86_64(GCC版本4.4.7 20120313(Red Hat 4.4.7-16)(GCC))
**操作系统:*CentOS 6.7(最终版)
**硬件:*8核Intel(R)Core(TM)i7-2630qm
**gfortran:*版本4.4.7 20120313(Red Hat 4.4.7-17)(gcc)
glmnet适用于“线性”回归、“logistic”和“多项式”回归模型、“poisson”回归和“cox”模型的整个套索或弹性网正则化路径。
fortran代码与“r”版本相同,使用循环路径坐标下降算法,如下文所述。
对高斯、多元高斯、二项式、多项式和泊松模型也进行了交叉验证。cox模型的cv尚未实现。
cv可以以串行和并行的方式实现。并行化是使用“多处理”和“joblib”库完成的。
在安装过程中,Fortran代码使用“gfortran”在本地计算机中编译,并由Python代码调用。
`````diff
+入门:
``````````
*使用此库的最佳起点是从` test`目录(glmnet_examples.ipynb)。这里提供了函数调用和参数值的详细说明以及大量示例,以便开始使用。*
\authors:
算法由Jerome Friedman、Trevor Haste和Rob Tibshirani设计。Fortran代码是由Jerome Friedman编写的。r wrapper(改编自Matlab wrapper)由Trevor Haste编写。
原始Matlab wrapper由Hui Jiang编写(2009年7月14日)。并由钱俊扬(2013年8月30日)更新和维护。
斯坦福大学统计系,斯坦福,加利福尼亚,美国。
参考文献:
*friedman,j.,haste,t.和tibshirani,r.(2008)通过坐标下降的广义线性模型的正则化路径,
http://www.jstatsoft.org/v33/i01/
*Journal of Statistical Software,Vol.33(1),1-22 Feb 2010*
*Simon,N.,Friedman,J.,Haste,T.,Tibshirani,R.(2011)Cox比例危险模型通过坐标下降的正则化路径,
http://www.jstatsoft.org/v39/i05/
*统计软件杂志,第39(5)卷1-13*
*Tibshirani,Robert.,Bien,J.,Friedman,J.,Haste,T.,Simon,N.,Taylor,J.和Tibshirani,Ryan.(2010)套索类问题中丢弃预测因子的强规则,
http://www-stat.stanford.edu/~tibs/ftp/strong.pdf
*斯坦福统计技术报告*
>b.j.balakumar
>bbalasub@stanford.edu.edu
>韩方
>hanfafafafafang.cshl@gmail.com
pip-install glmnet-py
p-install-glmnet-hub.com/han fang/glmnet_python.git
光盘glmnet_python
python setup.py install
要求:python3,linux
glmnet.so的签入版本是为以下配置编译的:
**Linux:*Linux版本2.6.32-573.26.1.el6.x86_64(GCC版本4.4.7 20120313(Red Hat 4.4.7-16)(GCC))
**操作系统:*CentOS 6.7(最终版)
**硬件:*8核Intel(R)Core(TM)i7-2630qm
**gfortran:*版本4.4.7 20120313(Red Hat 4.4.7-17)(gcc)
glmnet适用于“线性”回归、“logistic”和“多项式”回归模型、“poisson”回归和“cox”模型的整个套索或弹性网正则化路径。
fortran代码与“r”版本相同,使用循环路径坐标下降算法,如下文所述。
对高斯、多元高斯、二项式、多项式和泊松模型也进行了交叉验证。cox模型的cv尚未实现。
cv可以以串行和并行的方式实现。并行化是使用“多处理”和“joblib”库完成的。
在安装过程中,Fortran代码使用“gfortran”在本地计算机中编译,并由Python代码调用。
`````diff
+入门:
``````````
*使用此库的最佳起点是从` test`目录(glmnet_examples.ipynb)。这里提供了函数调用和参数值的详细说明以及大量示例,以便开始使用。*
\authors:
算法由Jerome Friedman、Trevor Haste和Rob Tibshirani设计。Fortran代码是由Jerome Friedman编写的。r wrapper(改编自Matlab wrapper)由Trevor Haste编写。
原始Matlab wrapper由Hui Jiang编写(2009年7月14日)。并由钱俊扬(2013年8月30日)更新和维护。
斯坦福大学统计系,斯坦福,加利福尼亚,美国。
参考文献:
*friedman,j.,haste,t.和tibshirani,r.(2008)通过坐标下降的广义线性模型的正则化路径,
http://www.jstatsoft.org/v33/i01/
*Journal of Statistical Software,Vol.33(1),1-22 Feb 2010*
*Simon,N.,Friedman,J.,Haste,T.,Tibshirani,R.(2011)Cox比例危险模型通过坐标下降的正则化路径,
http://www.jstatsoft.org/v39/i05/
*统计软件杂志,第39(5)卷1-13*
*Tibshirani,Robert.,Bien,J.,Friedman,J.,Haste,T.,Simon,N.,Taylor,J.和Tibshirani,Ryan.(2010)套索类问题中丢弃预测因子的强规则,
http://www-stat.stanford.edu/~tibs/ftp/strong.pdf
*斯坦福统计技术报告*