scikit learn laboratory使使用scikit learn运行机器学习实验变得更容易。

skll的Python项目详细描述


Build statushttps://img.shields.io/coveralls/EducationalTestingService/skll/master.svgLatest version on PyPILicenseConda package for SKLLSupported python versions for SKLLDOI for citing SKLL 1.0.0

这个python包提供了命令行实用程序,使其更易于运行 scikit学习的机器学习实验。的主要目标之一 我们的项目是使您可以运行scikit学习实验 实际上需要编写除用于生成/提取的代码以外的任何代码 特征。

命令行界面

我们提供的主要实用程序名为run_experiment,它可以用于 在配置文件中指定的数据集上轻松运行一系列学习程序 例如:

[General]experiment_name=Titanic_Evaluate_Tuned# valid tasks: cross_validate, evaluate, predict, traintask=evaluate[Input]# these directories could also be absolute paths# (and must be if you're not running things in local mode)train_directory=traintest_directory=dev# Can specify multiple sets of feature files that are merged together automatically# (even across formats)featuresets=[["family.ndj", "misc.csv", "socioeconomic.arff", "vitals.csv"]]# List of scikit-learn learners to uselearners=["RandomForestClassifier", "DecisionTreeClassifier", "SVC", "MultinomialNB"]# Column in CSV containing labels to predictlabel_col=Survived# Column in CSV containing instance IDs (if any)id_col=PassengerId[Tuning]# Should we tune parameters of all learners by searching provided parameter grids?grid_search=true# Function to maximize when performing grid searchobjectives=['accuracy'][Output]# Also compute the area under the ROC curve as an additional metricmetrics=['roc_auc']# The following can/should be absolute pathslog=outputresults=outputpredictions=outputmodels=output

有关开始使用run_experiment的详细信息,请检查 输出our tutorial,或 our config file specs

我们还提供以下实用程序:

python api

如果你只是想避免编写大量样板学习代码,你可以 还可以使用我们的简单python api,它还支持pandas数据帧。 使用api的主要方法是 LearnerReader类。有关我们的api的更多详细信息,请参见 the documentation

虽然我们的api可以广泛地使用,但应该注意的是,命令行 实用程序是使用skll的主要方式。这个api只是一个很好的 我们发展公用事业的副作用。

发音注意事项

SKLL logo
doc/spacer.png

scikit learn laboratory(skll)的发音是“骷髅”:这就是学习的地方 发生。

要求

对于其他功能,可以选择安装以下软件包 但不是必需的:

谈话

  • simpler machine learning with skll 1.0,dan blanchard,Pydata NYC 2014(videoslides
  • simpler machine learning with skll,dan blanchard,Pydata NYC 2013(videoslides

书籍

skll在Data Science at the Command Line中出现 通过Jeroen Janssens

更改日志

GitHub releases

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用split函数分割字符串,但没有得到期望的结果   未找到包含derby数据库嵌入架构的sql Java桌面应用程序错误   java elasticsearch vs solr用于定制全文搜索系统   java Android:创建没有startOffset的动画延迟?   java如何查看其他应用程序接收的数据?   java如何在Linux中使用D和classpath选项运行jar文件   java和域设计最佳实践   具有相同内存位置的java数组,将显示为输出   连接到java中的elasticsearch?   Java Playframework重定向到带有Json负载的外部url   java无法在Android平台上使用InputStream为蓝牙socket创建ObjectInputStream   使用POI将Excel日期转换为Java日期,年份未正确显示   oracle从数据库层还是Java层调用webservice?