从两个tf记录中获取所有记录的组合

2条回答

网友

1楼 · 编辑于 2024-04-23 18:46:48

有一些关于如何使用Numpy或Tensorflow计算两个数组的笛卡尔积的文章。你知道吗

如果您的数组对于内存中的计算来说是两个大的数组，那么您的最佳选择可能是使用两个tf.data.Dataset（对于每个数组为on）并进行双循环：

for a in dataset_A:
  for b in dataset_B.batch(2):
     batch = [[a, b[0]], [a, b[1]] # Or something similar (it should have a TF function to do it)

使用^{}，在数据集上循环是很快的。你知道吗

网友

2楼 · 编辑于 2024-04-23 18:46:48

您可以使用tf.data.Dataset.from_generator函数，其中生成器函数将实现您的逻辑，例如，其他两个数据集的叉积。为了从压缩的数据集db1和db2随机抽取一对样本，我对每个数据集分别进行了洗牌。你知道吗

import tensorflow as tf
tf.enable_eager_execution()

A = [1, 2, 3, 4]
B = [5, 6, 7, 8]

db1 = tf.data.Dataset.from_tensor_slices(A).shuffle(len(A)).repeat()
db2 = tf.data.Dataset.from_tensor_slices(B).shuffle(len(B)).repeat()

def cross_db_generator():
    for db1_example, db2_example in zip(db1, db2):
        print(db1_example.numpy(), db2_example.numpy())
        yield db1_example, db2_example


cross_db = tf.data.Dataset.from_generator(cross_db_generator, output_types=(tf.uint8, tf.uint8))
cross_db = cross_db.batch(2)

for sample in cross_db:
    print((sample[0][0].numpy(), sample[1][0].numpy()), (sample[0][1].numpy(), sample[1][1].numpy()))

相关问题更多 >

编程相关推荐

热门问题

热门文章

从两个tf记录中获取所有记录的组合

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >