正在运行带有GridSearchCV的Python-LightGBM

param_set = { 'n_estimators':[50, 100, 500, 1000] } gsearch = GridSearchCV(estimator = XGBClassifier( learning_rate =0.1, n_estimators=100, max_depth=5, min_child_weight=1, gamma=0, subsample=0.8, colsample_bytree=0.8, nthread=7, objective= 'binary:logistic', scale_pos_weight=1, seed=410), param_grid = param_set, scoring='roc_auc',n_jobs=7,iid=False, cv=10) xgb_model2 = gsearch.fit(features_train, label_train) xgb_model2.grid_scores_, xgb_model2.best_params_, xgb_model2.best_score_

param_set = { 'n_estimators':[20, 50] } gsearch = GridSearchCV(estimator = LGBMClassifier( boosting_type='gbdt', num_leaves=30, max_depth=5, learning_rate=0.1, n_estimators=50, max_bin=225, subsample_for_bin=0.8, objective=None, min_split_gain=0, min_child_weight=5, min_child_samples=10, subsample=1, subsample_freq=1, colsample_bytree=1, reg_alpha=1, reg_lambda=0, seed=410, nthread=7, silent=True), param_grid = param_set, scoring='roc_auc',n_jobs=7,iid=False, cv=10) lgb_model2 = gsearch.fit(features_train, label_train) lgb_model2.grid_scores_, lgb_model2.best_params_, lgb_model2.best_score_

2条回答

网友
1楼 · 编辑于 2024-05-13 21:11:01

最初的问题是由于lightgbm和GridSearchCV启动的线程太多（即机器上的线程太多）。如果是产品（或金额？这取决于这些功能的GridSearchCV是如何实现的，然后它将运行。如果有太多的线程发生冲突，并且lightgbm由于一些我不清楚的原因而停止执行，但是开发人员知道原因。

网友
2楼 · 编辑于 2024-05-13 21:11:01

尝试使用n_jobs = 1并查看它是否有效。
一般来说，如果您使用n_jobs = -1或n_jobs > 1，那么您应该使用if __name__=='__main__':来保护您的脚本：
简单示例：
import ... if __name__=='__main__': data= pd.read_csv('Prior Decompo2.csv', header=None) X, y = data.iloc[0:, 0:26].values, data.iloc[0:,26].values param_grid = {'C' : [0.01, 0.1, 1, 10], 'kernel': ('rbf', 'linear')} classifier = SVC() grid_search = GridSearchCV(estimator=classifier, param_grid=param_grid, scoring='accuracy', n_jobs=-1, verbose=42) grid_search.fit(X,y)
最后，你能试着用n_jobs = -1来运行你的代码吗，并且像我解释的那样包含if __name__=='__main__':，看看它是否有效？

相关问题更多 >

编程相关推荐

热门问题

热门文章