虚拟变量和使用for循环连接数据帧

2024-06-07 18:22:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用for循环获取虚拟变量,并在两个独立的数据帧中进行一些数据清理,但它不起作用,它编译了,但对我的数据帧没有任何影响

enter image description here

然后我来做这个

data_cleanBase = [dataABase, dataTestBase]
for dataset in data_cleanBase: 
    dataset = dataset.join(pd.get_dummies(dataset['Embarked'])).join(pd.get_dummies(dataset['Sex']))

我再一次得到

enter image description here

我的数据集中什么都没有发生


Tags: 数据imagefordatagetheredescriptiondataset
1条回答
网友
1楼 · 发布于 2024-06-07 18:22:20

要在遍历列表时替换列表中的元素,需要使用它们的索引引用列表中的元素

因此,如果您想就地修改列表:

data_cleanBase = [dataABase, dataTestBase]
for i, dataset in enumerate(data_cleanBase): 
    data_cleanBase[i] = dataset.join(pd.get_dummies(dataset['Embarked'])).join(pd.get_dummies(dataset['Sex']))

否则,您可以将结果放入新列表中:

data_cleanBase = [dataABase, dataTestBase]
augmented_data = []
for dataset in data_cleanBase:
    augmented_data.append(dataset.join(pd.get_dummies(dataset['Embarked'])).join(pd.get_dummies(dataset['Sex'])))

相关问题 更多 >

    热门问题