Tensorflow将字符串列转换为多个列进行分类

2024-04-19 13:32:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下格式的csv文件

feature_1 | feature_2 | ... | feature_n | label

其中标签的类型为string。我用pandas成功读取了文件:

^{pr2}$

但是,如tensorflow MNIST示例所示,标签的格式为

label_0 | label_1 | ... | label_9

其中,对于一个示例,只有一个标签是1,其他所有标签都是0。由于我的proced_data的标签是一列字符串,我想知道将其转换为类似mnist格式的最快方法是什么?在

谢谢。在


Tags: 文件csv示例类型pandasdatastringtensorflow
1条回答
网友
1楼 · 发布于 2024-04-19 13:32:35

Pandas有一个热编码器,所以您可以使用^{}将标签转换为虚拟变量。在

就你而言

import pandas as pd
data = pd.read_csv("dataset/iris.csv", delimiter=",")
y = pd.get_dummies(data['label'])

顺便说一句,还有一个音符。您应该先做import pandas as pd,然后再做pd.read_csv(..)。这是将熊猫打包进口的常用方法。在

相关问题 更多 >