Tensorflow：从numpy数组创建minibatch>2 GB

def main(mode, steps): config = Configuration(mode, steps) if config.TRAIN_MODE: images, labels = read_data(config.simID) assert images.shape[0] == labels.shape[0] images_placeholder = tf.placeholder(images.dtype, images.shape) labels_placeholder = tf.placeholder(labels.dtype, labels.shape) dataset = tf.data.Dataset.from_tensor_slices( (images_placeholder, labels_placeholder)) # shuffle dataset = dataset.shuffle(buffer_size=1000) # batch dataset = dataset.batch(batch_size=config.batch_size) iterator = dataset.make_initializable_iterator() image, label = iterator.get_next() model = Model(config, image, label) with tf.Session() as sess: sess.run(tf.global_variables_initializer()) sess.run(iterator.initializer, feed_dict={images_placeholder: images, labels_placeholder: labels}) # ... for step in xrange(steps): sess.run(model.optimize)

1条回答

网友

1楼 · 发布于 2024-04-19 18:56:41

您正在使用tf.Data的initializable iterator向模型提供数据。这意味着您可以根据占位符参数化数据集，然后调用迭代器的初始值设定项op来准备使用它。在

如果您使用可初始化的迭代器或来自tf.Data的任何其他迭代器向模型提供输入，则不应使用sess.run的feed_dict参数来尝试进行数据馈送。相反，根据iterator.get_next()的输出定义模型，并省略sess.run中的{}。在

大致如下：

iterator = dataset.make_initializable_iterator()
image_batch, label_batch = iterator.get_next()

# use get_next outputs to define model
model = Model(config, image_batch, label_batch) 

# placeholders fed in while initializing the iterator
sess.run(iterator.initializer, 
            feed_dict={images_placeholder: images,
                       labels_placeholder: labels})

for step in xrange(steps):
     # iterator will feed image and label in the background
     sess.run(model.optimize)

迭代器将在后台向模型提供数据，不需要通过feed_dict进行额外的数据馈送。在

相关问题更多 >

编程相关推荐

热门问题

热门文章