小数据集上的CNN过度装修

train_X, test_X, train_Y, test_Y = train_test_split(cnn_mat, img_bin["Classification"], test_size = 0.2, random_state = 0) class_weights = class_weight.compute_class_weight('balanced', np.unique(train_Y), train_Y) train_Y_one_hot = to_categorical(train_Y) test_Y_one_hot = to_categorical(test_Y) train_X,valid_X,train_label,valid_label = train_test_split(train_X, train_Y_one_hot, test_size=0.2, random_state=13) model = Sequential() model.add(Conv2D(24,kernel_size=3,padding='same',activation='relu', input_shape=(96,96,1))) model.add(MaxPool2D()) model.add(Conv2D(48,kernel_size=3,padding='same',activation='relu')) model.add(MaxPool2D()) model.add(Conv2D(64,kernel_size=3,padding='same',activation='relu')) model.add(MaxPool2D()) model.add(Flatten()) model.add(Dense(128, activation='relu')) model.add(Dense(256, activation='relu')) model.add(Dense(16, activation='softmax')) model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"]) train = model.fit(train_X, train_label, batch_size=80,epochs=20,verbose=1,validation_data=(valid_X, valid_label),class_weight=class_weights)

model.add(Conv2D(48,kernel_size=3,padding='same',activation='relu')) model.add(MaxPool2D()) model.add(Dropout(0.8)) model.add(Conv2D(64,kernel_size=3,padding='same',activation='relu')) model.add(MaxPool2D()) model.add(Dropout(0.8))

2条回答

网友
1楼 · 编辑于 2024-04-26 01:00:48

我认为根据不平衡的数据，最好为您的模型创建一个定制的数据生成器，以便每个生成的数据批至少包含来自每个类的一个样本。而且最好在每个dense层之后使用Dropout层而不是conv层。对于数据扩充，最好至少使用旋转、水平翻转和垂直翻转的组合。还有一些其他的数据扩充方法，比如使用GAN网络或随机像素替换。对于Gan，您可以检查This SO post
要使用Gan作为数据增强器，可以读取This Article。用于像素级增强和GANpixel level data augmentation的组合

网友
2楼 · 编辑于 2024-04-26 01:00:48

我在另一个环境中使用的是用ADASYN对我的数据进行上采样。此算法计算平衡类所需的新数据量，然后提取可用数据来采样新示例。你知道吗
有一个Python的实现。否则，你也只有很少的数据。支持向量机即使在数据很少的情况下也表现良好。您可能希望尝试它们或其他图像分类算法，这取决于预期模式始终位于同一位置或不同的位置。然后你也可以尝试Viola-Jones对象检测框架。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章