OneHot编码与相关

2024-04-19 05:46:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个热编码的列“postcode”,我想看看它和被标签编码为:(mass customer = 0, affluent customer = 1 and high net worth customer = 2)的wealth_段之间的关系

我想看看邮政编码和客户财富之间是否存在相关性。问题是,我有很多列的邮政编码,因为我有一个热编码。命名约定为邮政编码_XXXX(XXXX为4位数字)

我可以写些什么来找出这两个变量之间的相关性?我在dataframe中还有100多个其他列,所以我不想简单地使用df.corr()方法


Tags: and编码net客户关系customer标签mass
1条回答
网友
1楼 · 发布于 2024-04-19 05:46:15

如果您只需要每个邮政编码列与财富段列的相关值,您可以简单地迭代包含邮政编码的列名,在每次迭代中过滤数据帧,并在过滤的数据帧上使用df.corr()

例:

cols = [c for c in df.columns if c.startswith('postcode_')]

for col in cols:
    filter_df = df[[col, 'wealth_segment']]
    print(filter_df.corr())

相关问题 更多 >