如何从Scikit Learn中的详细输出估计GridSearchCV的进度？

param_test = {"loss":["deviance"], 'learning_rate':[0.01, 0.025, 0.05, 0.075, 0.1, 0.15, 0.2], "min_samples_split": np.linspace(0.1, 0.5, 12), "min_samples_leaf": np.linspace(0.1, 0.5, 12), "max_depth":[3,5,8], "max_features":["log2","sqrt"], "min_impurity_split":[5e-6, 1e-7, 5e-7], "criterion": ["friedman_mse", "mae"], "subsample":[0.5, 0.618, 0.8, 0.85, 0.9, 0.95, 1.0], "n_estimators":[10]} Mod_gsearch = GridSearchCV(estimator = GradientBoostingClassifier(), param_grid = param_test, scoring="accuracy",n_jobs=32, iid=False, cv=cv_indices, verbose=2)

$ cat ./gridsearch.e8475533 [Parallel(n_jobs=32)]: Done 132 tasks | elapsed: 1.2s [Parallel(n_jobs=32)]: Done 538 tasks | elapsed: 2.8s [Parallel(n_jobs=32)]: Done 1104 tasks | elapsed: 4.8s [Parallel(n_jobs=32)]: Done 1834 tasks | elapsed: 7.9s [Parallel(n_jobs=32)]: Done 2724 tasks | elapsed: 11.6s ... [Parallel(n_jobs=32)]: Done 3396203 tasks | elapsed: 250.2min [Parallel(n_jobs=32)]: Done 3420769 tasks | elapsed: 276.5min [Parallel(n_jobs=32)]: Done 3447309 tasks | elapsed: 279.3min [Parallel(n_jobs=32)]: Done 3484240 tasks | elapsed: 282.3min [Parallel(n_jobs=32)]: Done 3523550 tasks | elapsed: 285.3min

1条回答

网友

1楼 · 发布于 2024-04-18 22:24:01

数学很简单，但乍一看有点误导：

当每个任务启动时，日志记录机制会生成一个“[CV]…”行到stdout注意执行的starting和任务后的ends另一行，其中添加了特定任务的花费时间（在行的末尾）。
此外，对于某些时间间隔，日志记录机制会将进度条写入stderr（或者如果将verbose设置为>；50到stdout），指示总任务（fits）和当前总花费时间中已完成的任务数，例如：
[Parallel(n_jobs=32)]: Done 2724 tasks | elapsed: 11.6s

对于您的情况，您有5842368完全适合，即任务。

您计算了“[CV]…”中的7047332，即around 7047332/2 = 3523666已完成的任务，进度条显示了exactly已完成的任务数-3523550（大约-因为有些任务可以开始，但在计算时不会结束）。

相关问题更多 >

编程相关推荐

热门问题

热门文章