如何在Tensorflow数据集中提供整数列表作为输入?

2024-04-26 17:16:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我们正在尝试使用tensorflow对预训练的RoBERTa模型进行微调/训练。为此,我们必须从数据帧创建一个tf.data.Dataset

数据帧如下所示: Traindata

其中三个选项是编码字符串,答案是与选项A、B或C相对应的整数

我们尝试使用以下方法从中生成tf.dataset:

features= ['OptionA', 'OptionB', 'OptionC']

training_dataset = (
    tf.data.Dataset.from_tensor_slices(
        (
            tf.cast(train_data[features].values, tf.float32),
            tf.cast(train_data['Answer'].values, tf.int32)
        )
    )
)

但是,这不起作用,因为我们得到以下错误:

ValueError:无法将NumPy数组转换为张量(不支持的对象类型列表)

我已经读到,我们不能将列表用作tf.dtype,我们现在在其中放置了'float32'。但是我们也不能将数据帧中的列表转换为浮动

如果有人能为我们指出正确的方向,我们将不胜感激! 提前谢谢


Tags: 数据模型列表datatftensorflow选项train