构建状态1244构建状态124Coverage状态124PYPI版本1244[“124license 1244;](http://www.apache.org/licenses/license-2.0)[124DOI-1244documentation 124;](http://msmbuilder.org/osprey)
ospre的Python项目详细描述
[] (http://www.apache.org/licenses/LICENSE-2.0)[] (http://msmbuilder.org/osprey)
徽标
鱼鹰是一个易于使用的超参数优化工具 使用scikit learn(或使用 scikit学习兼容的api)。
每一个鱼鹰实验都结合了一个数据集、一个估计器、一个搜索空间。 (和引擎),交叉验证和异步序列化 模型超参数的分布式并行优化。
文档
有关完整文档,请访问Osprey homepage。
安装
如果您有一个anaconda python发行版,安装非常简单:
$ conda install -c omnia osprey
您也可以使用pip:
安装鱼鹰$ pip install osprey
或者,您可以直接从github repo安装:
$ git clone https://github.com/msmbuilder/osprey.git $ cd osprey && git checkout 1.1.0 $ python setup.py install
使用MSMBuilder
的示例下面是要交叉验证的ospreyconfig文件的示例 基于变簇数和二面体的马尔可夫状态模型 模型中使用的角度:
estimator:eval_scope:msmbuildereval:|Pipeline([('featurizer', DihedralFeaturizer(types=['phi', 'psi'])),('cluster', MiniBatchKMeans()),('msm', MarkovStateModel(n_timescales=5, verbose=False)),])search_space:cluster__n_clusters:min:10max:100type:intfeaturizer__types:choices:-['phi','psi']-['phi','psi','chi1']type:enumcv:5dataset_loader:name:mdtrajparams:trajectories:~/local/msmbuilder/Tutorial/XTC/*/*.xtctopology:~/local/msmbuilder/Tutorial/native.pdbstride:1trials:uri:sqlite:///osprey-trials.db
然后运行osprey worker。可以运行的多个并行实例 osprey worker同时在集群上。
$ osprey worker config.yaml ... ---------------------------------------------------------------------- Beginning iteration 1 / 1 ---------------------------------------------------------------------- History contains: 0 trials Choosing next hyperparameters with random... {'cluster__n_clusters': 20, 'featurizer__types': ['phi', 'psi']} Fitting 5 folds for each of 1 candidates, totalling 5 fits [Parallel(n_jobs=1)]: Done 1 jobs | elapsed: 0.3s [Parallel(n_jobs=1)]: Done 5 out of 5 | elapsed: 1.8s finished --------------------------------- Success! Model score = 4.080646 (best score so far = 4.080646) --------------------------------- 1/1 models fit successfully. time: October 27, 2014 10:44 PM elapsed: 4 seconds. osprey worker exiting.
您可以使用osprey dump将数据库转储到json或csv。
依赖关系
- python>=2.7.11
- six>=1.10.0
- pyyaml>=3.11
- numpy>=1.10.4
- scipy>=0.17.0
- scikit-learn>=0.17.0
- sqlalchemy>=1.0.10
- bokeh>=0.12.0
- matplotlib>=1.5.0
- pandas>=0.18.0
- GPy(可选,对于gp策略是必需的)
- hyperopt(可选,对于hyperopt_tpe策略是必需的)
- nose(可选,用于测试)
贡献
如果你对这个包裹有任何问题,请考虑 向GitHub Issue Tracker提交票证。我们也 欢迎任何功能请求,并高度鼓励用户submit pull requests 用于错误修复和改进。
有关更多详细信息,请参阅 documentation。
引用
如果你在研究中使用鱼鹰,请引用:
@misc{osprey,author={Robert T. McGibbon and Carlos X. Hernández and Matthew P. Harrigan and Steven Kearnes and Mohammad M. Sultan and Stanislaw Jastrzebski and Brooke E. Husic and Vijay S. Pande},title={Osprey 1.0.0},month=jun,year=2016,doi={10.5281/zenodo.56251},url={http://dx.doi.org/10.5281/zenodo.56251}}