如何转换数据格式以用于VGG16深度学习

2条回答

网友

1楼 · 编辑于 2024-04-20 03:54:14

IMAGE_SIZE = [512, 512] # any image size 192, 224, 331, 512
# 512 works for TPU as GPU has memory limit
# Decode Function
def decode_image(image_data):
    image = tf.image.decode_jpeg(image_data, channels=3)
    image = tf.cast(image, tf.float32) / 255.0  # convert image to floats in [0, 1] range
    image = tf.reshape(image, [*IMAGE_SIZE, 3]) # size needed for TRAINING
    return image

# Now train with ant pretrained models
pretrained_model = tf.keras.applications.VGG16(weights='imagenet', include_top=False ,input_shape=[*IMAGE_SIZE, 3])
pretrained_model.trainable = False # False = transfer learning, True = fine-tuning

网友

2楼 · 编辑于 2024-04-20 03:54:14

要解决此问题，应首先使用reshape函数将数据转换为具有形状(26859, 48, 48, 3)的张量，如下所示：

X_train.reshape((26859, 48, 48, 3))

之后，由于VGG16网络接受形状为(size, 224, 224, 3)的张量，因此应该使用零填充向训练和测试图像的边界插入额外的零，以增加它们的宽度和高度

对输入张量进行零填充的可用函数之一是tf.keras.layers.ZeroPadding2D。它是一个额外的层，将零填充应用于输入张量

有关ZeroPadding2D层的更多信息，请参阅其文档tf.keras.layers.ZeroPadding2D API DOC

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何转换数据格式以用于VGG16深度学习

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >