减少cnn的培训时间

from keras.layers import Conv2D, MaxPooling2D, GlobalAveragePooling2D from keras.layers import Dropout, Flatten, Dense from keras.models import Sequential model = Sequential() model.add(Conv2D(16, (3,3), input_shape=(224,224,3), activation = 'relu')) model.add(MaxPooling2D(pool_size=(2,2))) model.add(Conv2D(16, (3,3), activation= 'relu')) model.add(MaxPooling2D(pool_size =(2,2))) model.add(Conv2D(32, (3,3), activation= 'relu')) model.add(GlobalAveragePooling2D()) model.add(Dense(units=64, activation= 'relu')) model.add(Dropout(0.3)) model.add(Dense(units= 133, activation = 'softmax')) model.summary()

1条回答

网友

1楼 · 发布于 2024-06-02 07:49:04

大多数训练计算发生在第一层Conv2D层：

Conv2D(16, (3,3), input_shape=(224,224,3), activation = 'relu')

在这一层中有(224 - 2)*(224 - 2) = 49284大小的3x3和{}滤波器，它们总共为前向和后向传递提供了近800k（确切地说是788544）的卷积运算。这还没有考虑到你的批量大小。在

我建议您在第一层使用striding，例如strides=(2, 2)将减少4倍的补丁数量。此外，网络执行跨步降采样。这意味着您可以去掉下一个MaxPooling2D层，只需要一个卷积层就可以得到相同的特征映射大小。在

当然，网络会失去一些灵活性，但不会对准确性造成太大影响。在

相关问题更多 >

编程相关推荐

热门问题

热门文章