python中的大规模稀疏线性分类、回归与排序
sklearn-contrib-lightning的Python项目详细描述
闪电
Lightning是一个用于大规模线性分类、回归和 在python中排名。
亮点:
- 遵循scikit-learnapi惯例
- 支持本机密集和稀疏数据表示形式
- 在Cython 中实现的计算要求较高的部分
支持的解算器:
- 原始坐标下降
- 双坐标下降(SDCA、PROX SDCA)
- SGD、ADAGRAD、SAG、SAGA、SVRG
- 费斯塔
示例
演示如何使用组套索学习多类分类器的示例 news20数据集的惩罚(c.f.,Blondel et al. 2013):
fromsklearn.datasetsimportfetch_20newsgroups_vectorizedfromlightning.classificationimportCDClassifier# Load News20 dataset from scikit-learn.bunch=fetch_20newsgroups_vectorized(subset="all")X=bunch.datay=bunch.target# Set classifier options.clf=CDClassifier(penalty="l1/l2",loss="squared_hinge",multiclass=True,max_iter=20,alpha=1e-4,C=1.0/X.shape[0],tol=1e-3)# Train the model.clf.fit(X,y)# Accuracyprint(clf.score(X,y))# Percentage of selected featuresprint(clf.n_nonzero(percentage=True))
依赖性
闪电需要python>;=2.7,setuptools,numpy>;=1.3,scipy>;=0.7和 SCIKIT学习>;=0.15。从源代码构建也需要Cython和一个工作的C/C++编译器。要运行测试,还需要nose>;=0.10。
安装
Lightning稳定版本的预编译二进制文件可用于主要平台,并可使用pip安装:
pip install sklearn-contrib-lightning
或条件:
conda install -c conda-forge sklearn-contrib-lightning
Lightning的开发版本可以从其Git存储库安装。在这种情况下,假设您有Git版本控制系统、工作C++编译器、Cython和NUMPY开发库。要安装开发版本,请键入:
git clone https://github.com/scikit-learn-contrib/lightning.git cd lightning python setup.py build sudo python setup.py install
引用
如果你使用这个软件,请引用它。这是一个bibtex片段,您可以使用:
@misc{lightning_2016, author = {Blondel, Mathieu and Pedregosa, Fabian}, title = {{Lightning: large-scale linear classification, regression and ranking in Python}}, year = 2016, doi = {10.5281/zenodo.200504}, url = {https://doi.org/10.5281/zenodo.200504} }
其他引用格式可在its Zenodo entry中找到。