在Python中,多个列之间的相关性如何大于2个变量?

2024-04-24 07:51:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫数据框,如下所示:

id    cat1    cat2    cat3    num1    num2
1     0       WN      29      2003    98
2     1       TX      12      755     76
3     0       WY      11      845     32
4     1       IL      19      935     46

我想找出Cat1和cat3列、num1和num2之间的关系 或者在cat1和num1和num2之间 或介于2类和1类、3类、num1、num2之间

当我使用df.corr()时,它给出了数据帧中所有列之间的相关性,但我希望看到上面详细描述的这些选择性列之间的相关性。

在大熊猫Python身上我该怎么做?

万分感谢你的回答。


Tags: 数据iddf关系iltxwycat1
1条回答
网友
1楼 · 发布于 2024-04-24 07:51:21

我试了一下,结果成功了:

features1=list(['cat1','cat2','cat3'])
features2=list(['Cat1', 'Cat2','num1','num2'])

df[features1].corr()
df[features2].corr()

当数据集中有大量变量时,根据需要选择列的好方法。

相关问题 更多 >