将tf.dataset转换为4D张量

import tensorflow as tf import tensorflow_datasets as tfds builder = tfds.builder('mnist') builder.download_and_prepare() (raw_train, raw_test) = builder.as_dataset(split=[tfds.Split.TRAIN, tfds.Split.TEST]) model = tf.keras.Sequential() model.add(tf.keras.layers.Conv2D(filters=6, kernel_size=5, activation=tf.keras.activations.sigmoid, input_shape=(28, 28 ,1))) model.add(tf.keras.layers.AveragePooling2D(pool_size=(2, 2), strides=2)) model.add(tf.keras.layers.Conv2D(filters=16, kernel_size=5, activation=tf.keras.activations.sigmoid)) model.add(tf.keras.layers.AveragePooling2D(pool_size=(2, 2), strides=2)) # model.add(Flatten()) model.add(tf.keras.layers.Dense(120, activation=tf.keras.activations.sigmoid)) model.add(tf.keras.layers.Dense(84, activation=tf.keras.activations.sigmoid)) model.add(tf.keras.layers.Dense(10)) result = model.compile(optimizer=tf.keras.optimizers.Adam(), loss=tf.keras.losses.BinaryCrossentropy(from_logits=True), metrics=['accuracy']) # model.summary() train_images = [] train_labels = [] for i in raw_train: image = i["image"] # image = image.reshape(-1,28, 28, 1) train_images.append(image) label = i["label"] train_labels.append(label) model.fit(train_images, train_labels, epochs=10)

import tensorflow as to tf.debugging.set_log_device_placement(True) import tensorflow_datasets as tfds import numpy as np builder = tfds.builder('mnist') builder.download_and_prepare() (raw_train, raw_test) = builder.as_dataset(split=[tfds.Split.TRAIN, tfds.Split.TEST]) raw_train = raw_train.batch(128).prefetch(128) raw_test = raw_test.batch(128).prefetch(128) model = tf.keras.Sequential() model.add(tf.keras.layers.Conv2D(filters=6, kernel_size=5, activation=tf.keras.activations.sigmoid, input_shape=(28, 28 ,1))) model.add(tf.keras.layers.AveragePooling2D(pool_size=(2, 2), strides=2)) model.add(tf.keras.layers.Conv2D(filters=16, kernel_size=5, activation=tf.keras.activations.sigmoid)) model.add(tf.keras.layers.AveragePooling2D(pool_size=(2, 2), strides=2)) # model.add(Flatten()) model.add(tf.keras.layers.Dense(120,activation=tf.keras.activations.sigmoid)) model.add(tf.keras.layers.Dense(84,activation=tf.keras.activations.sigmoid)) model.add(tf.keras.layers.Dense(10)) result = model.compile(optimizer=tf.keras.optimizers.Adam(), loss=tf.keras.losses.BinaryCrossentropy(from_logits=True), metrics=['accuracy']) train_images = [] train_labels = [] for i in raw_train: image = i["image"] train_images.append(image) label = i["label"] train_labels.append(label) with tf.device('/GPU:0'): model.fit(train_images, train_labels, epochs=10)

2条回答

网友

1楼 · 编辑于 2024-04-19 04:47:45

这不是确切的答案。。。因为它解决了我的问题，但带来了另一个问题）首先，我认为将张量列表转换为4D张量不是最好的主意，因为它使用NumPy执行，而NumPy使用了我的CPU的一个核心-我无法等待此操作的结果。我发现还有一种方法我更喜欢，从我的角度来看，它看起来更好——它使用tf.dataset.map，然后使用批处理，然后使用预取函数。我还不知道如何使用它们，但我正在往这边挖。。就目前而言，我认为这是一种更正确、更具前瞻性的方式

import tensorflow as tf
tf.debugging.set_log_device_placement(True)
import tensorflow_datasets as tfds
import numpy as np


builder = tfds.builder('mnist')
builder.download_and_prepare()

(raw_train, raw_test) = builder.as_dataset(split=[tfds.Split.TRAIN, tfds.Split.TEST],shuffle_files=False)

def divide(record):
    image = record["image"]
    label = record["label"]
    return image,label

train_ds = raw_train.map(divide , num_parallel_calls=tf.data.experimental.AUTOTUNE).batch(128).prefetch(128)
test_ds = raw_test.map(divide , num_parallel_calls=tf.data.experimental.AUTOTUNE).batch(128).prefetch(128)
print(type(train_ds))

model = tf.keras.Sequential()
model.add(tf.keras.layers.Conv2D(filters=6, kernel_size=(5,5), activation=tf.keras.activations.sigmoid, input_shape=(28, 28 ,1)))
model.add(tf.keras.layers.AveragePooling2D(pool_size=(2, 2), strides=2))
model.add(tf.keras.layers.Conv2D(filters=16, kernel_size=(5,5), activation=tf.keras.activations.sigmoid))
model.add(tf.keras.layers.AveragePooling2D(pool_size=(2, 2), strides=2))
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(120, activation=tf.keras.activations.sigmoid))
model.add(tf.keras.layers.Dense(84, activation=tf.keras.activations.sigmoid))
model.add(tf.keras.layers.Dense(10))

result = model.compile(optimizer=tf.keras.optimizers.Adam(),
              loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              metrics=['accuracy'])

image_batch, label_batch = next(iter(train_ds))

print(image_batch.shape)
print(label_batch.shape)

with tf.device('/GPU:0'):
    model.fit(image_batch, label_batch, epochs=10)

这段代码也不起作用，但我认为这是因为模型需要32x32而不是我提供给模型的28x28。我还在工作-如果你知道如何解决问题和如何操作批次，请让我知道。谢谢你的建议

网友

2楼 · 编辑于 2024-04-19 04:47:45

它还没有完成，但我还有下一步。为了使上一个代码正常工作，我添加了one_hot_y=tf.one_hot（label_batch，10）

import tensorflow as tf
tf.debugging.set_log_device_placement(True)
import tensorflow_datasets as tfds
import numpy as np
from time import time

builder = tfds.builder('mnist')
builder.download_and_prepare()

(raw_train, raw_test) = builder.as_dataset(split=[tfds.Split.TRAIN, tfds.Split.TEST],shuffle_files=False)

def divide(record):
    image = record["image"]
    image = tf.image.resize_with_pad(image, 32,32)
    label = record["label"]
    return image,label

train_ds = raw_train.map(divide, num_parallel_calls=tf.data.experimental.AUTOTUNE).batch(128).prefetch(128)
test_ds = raw_test.map(divide , num_parallel_calls=tf.data.experimental.AUTOTUNE).batch(128).prefetch(128)
print(type(train_ds))

model = tf.keras.Sequential()
model.add(tf.keras.layers.Conv2D(filters=6, kernel_size=(5,5), activation=tf.keras.activations.sigmoid, input_shape=(32, 32 ,1)))
model.add(tf.keras.layers.AveragePooling2D(pool_size=(2, 2), strides=2))
model.add(tf.keras.layers.Conv2D(filters=16, kernel_size=(5,5), activation=tf.keras.activations.sigmoid))
model.add(tf.keras.layers.AveragePooling2D(pool_size=(2, 2), strides=2))
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(120, activation=tf.keras.activations.sigmoid))
model.add(tf.keras.layers.Dense(84, activation=tf.keras.activations.sigmoid))
model.add(tf.keras.layers.Dense(10))

result = model.compile(optimizer=tf.keras.optimizers.Adam(),
              loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
              metrics=['accuracy'])


image_batch, label_batch = next(iter(train_ds))

print(image_batch.shape)
print(label_batch.shape)

one_hot_y = tf.one_hot(label_batch, 10)
print(one_hot_y.shape)

with tf.device('/GPU:0'):
    model.fit(image_batch, one_hot_y, epochs=10)

下一步是找出使用批处理在数据集中的整个项目中移动哪些步骤是正确的

相关问题更多 >

编程相关推荐

热门问题

热门文章