如何使用IMBREAN pipeline:TypeError:cannotpickle\u thread.RLock对象在sklearn gridsearchcv之后保存模型

2024-04-19 21:01:59 发布

男 | 程序猿一只，喜欢编程写python代码。

我面临的问题是，在处理一个极不平衡的数据集时，我使用IMBREAN pipeline和sklearn gridsearchcv执行了网格搜索，但当我尝试保存模型时，我得到了错误“TypeError:can't pickle _thread.RLock objects”。我用来保存模型的语句是

案例1：

import pickle

pickle.dump(grid_result,open(model_filename,'wb'))

案例2：

from sklearn.externals import joblib

joblib.dump(grid_result.best_estimator_, 'GS_obj.pkl')

1）对于二进制分类问题，我定义了如下所示的模型体系结构

构建函数以创建KerasClassifier所需的模型

def create_model(optimizer_val='RMSprop',hidden_layer_size=16,activation_fn='relu',dropout_rate=0.1,regularization_fn=tf.keras.regularizers.l1(0.001),kernel_initializer_fn=tf.keras.initializers.glorot_uniform,bias_initializer_fn=tf.keras.initializers.zeros):

    model = tf.keras.models.Sequential([

    tf.keras.layers.Dropout(0.2),                                       

    tf.keras.layers.Input(shape=(D,)),

     tf.keras.layers.Dense(units=1024, activation='relu',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), # 1st Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),

    tf.keras.layers.Dense(units=1024, activation='relu',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #2nd Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),

    tf.keras.layers.Dense(units=1024, activation='relu',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #3rd Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),   

    tf.keras.layers.Dense(units=1024, activation='relu',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #4th Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),       

    tf.keras.layers.Dense(units=1024, activation='relu',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #5th Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),       

    tf.keras.layers.Dense(units=1024, activation='relu',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #6th Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),         

    tf.keras.layers.Dense(units=1024, activation='relu',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #7th Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),       

    tf.keras.layers.Dense(units=1024, activation='relu',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #8th Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),           

    tf.keras.layers.Dense(units=1024, activation=activation_fn,kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #9th Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),     

    tf.keras.layers.Dense(units=1024, activation=activation_fn,kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn), #10th Layer

    tf.keras.layers.BatchNormalization(),   

    tf.keras.layers.Dropout(dropout_rate),   

   tf.keras.layers.Dense(units=1,activation='sigmoid',kernel_regularizer=regularization_fn,kernel_initializer=kernel_initializer_fn,bias_initializer=bias_initializer_fn) ])



    model.compile(optimizer=optimizer_val, loss='binary_crossentropy',metrics=['binary_accuracy'])

    return model



#Create the model with the wrapper

model = tf.keras.wrappers.scikit_learn.KerasClassifier(build_fn=create_model,verbose=2) #We donot specify batch_size and epochs here as it is part of the parameter grid

2）构建参数搜索网格，如下所示

初始化参数网格

nn_param_grid = {

    'NN_clf__epochs': [500],     

    'NN_clf__batch_size':[32],

    'NN_clf__optimizer_val': ['Adam','SGD'],

    'NN_clf__hidden_layer_size': [1024],

    'NN_clf__activation_fn': ['relu'],     

    'NN_clf__dropout_rate': [0.5],   

    'NN_clf__regularization_fn':['L1L2'],

    'NN_clf__kernel_initializer_fn':['glorot_normal', 'glorot_uniform'], #Works   

    'NN_clf__bias_initializer_fn':[tf.keras.initializers.zeros]   

}

2）实例化管道并执行GridSearch，如下所示

实例化SMOTE对象

smote_obj=SMOTE(sampling_strategy='minority',random_state=42,n_jobs=-1)

实例化Scaler对象

scaler_obj=StandardScaler()

实例化管道

steps = [('standardize', scaler_obj),('oversample', smote_obj),('NN_clf', model)]

pipe_clf = Pipeline(steps)

pipe_clf

执行GridSearchCV

grid = GridSearchCV(estimator=pipe_clf, param_grid=nn_param_grid, verbose=2, cv=10,scoring='precision',return_train_score=False,n_jobs=-1) 

grid_result = grid.fit(X_train, y_train)

请告知如何使用下面给出的保存模型，我无法保存模型并获得错误“TypeError:can't pickle\u thread.RLock objects”

案例1：

import pickle

pickle.dump(grid_result,open(model_filename,'wb'))

案例2：

from sklearn.externals import joblib

joblib.dump(grid_result.best_estimator_, 'GS_obj.pkl')

谢谢

苏拉吉特

Tags： rate layers tf activation kernel grid dropout keras

0条回答

目前没有回答

如何使用IMBREAN pipeline:TypeError:cannotpickle\u thread.RLock对象在sklearn gridsearchcv之后保存模型

构建函数以创建KerasClassifier所需的模型

初始化参数网格

实例化SMOTE对象

实例化Scaler对象

实例化管道

执行GridSearchCV

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用IMBREAN pipeline:TypeError:cannotpickle\u thread.RLock对象在sklearn gridsearchcv之后保存模型

构建函数以创建KerasClassifier所需的模型

初始化参数网格

实例化SMOTE对象

实例化Scaler对象

实例化管道

执行GridSearchCV

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >