使用scikit learn和dask进行超参数搜索的工具
dask-searchcv的Python项目详细描述
用于执行超参数搜索的工具 Scikit-Learn和Dask。
亮点
- 替换scikit learn的GridSearchCV和 RandomizedSearchCV。
- 超参数优化可以使用线程、进程和 或者分布在集群中。
- 适用于DASK集合。dask数组、数据帧和延迟可以是 传递给fit。
- 具有相同参数和输入的候选估计器将只适合 一次。对于诸如Pipeline这样的复合估计量,这可能是非常重要的 更有效,因为它可以避免昂贵的重复计算。
有关更多信息,请查看documentation。
安装
dask searchcv可通过conda或pip:
# Install with conda $ conda install dask-searchcv -c conda-forge # Install with pip $ pip install dask-searchcv
示例
fromsklearn.datasetsimportload_digitsfromsklearn.svmimportSVCimportdask_searchcvasdcvimportnumpyasnpdigits=load_digits()param_space={'C':np.logspace(-4,4,9),'gamma':np.logspace(-4,4,9),'class_weight':[None,'balanced']}model=SVC(kernel='rbf')search=dcv.GridSearchCV(model,param_space,cv=3)search.fit(digits.data,digits.target)