如何使用TensorFlow中我自己的数据将图像分割为测试集和训练集

# determine names of classes CLASS_NAMES = np.array([item.name for item in data_dir.glob('*') if item.name != "LICENSE.txt"]) print(CLASS_NAMES) # count images image_count = len(list(data_dir.glob('*/*.png'))) print(image_count) # load the files as a tf.data.Dataset list_ds = tf.data.Dataset.list_files(str(cwd + '/train/' + '*/*'))

2条回答

网友

1楼 · 编辑于 2024-04-24 15:12:34

您可以使用tf.keras.preprocessing.image.ImageDataGenerator：

image_generator = tf.keras.preprocessing.image.ImageDataGenerator(validation_split=0.2)
train_data_gen = image_generator.flow_from_directory(directory='train',
                                                     subset='training')
val_data_gen = image_generator.flow_from_directory(directory='train',
                                                   subset='validation')

请注意，您可能需要为生成器设置其他data-related parameters

更新：您可以通过skip()和take()获取数据集的两个切片：

val_data = data.take(val_data_size)
train_data = data.skip(val_data_size)

网友

2楼 · 编辑于 2024-04-24 15:12:34

如果所有数据都在同一文件夹中，并且希望使用tf.data将其拆分为验证/测试，请执行以下操作：

list_ds = tf.data.Dataset.list_files(str(cwd + '/train/' + '*/*'))
image_count = len(list(data_dir.glob('*/*.png')))

val_size = int(image_count * 0.2) 
train_set = list_ds.skip(val_size)
val_set = list_ds.take(val_size)

相关问题更多 >

编程相关推荐

热门问题

热门文章