如何找到分类列和数字列之间的相关性

2024-03-29 08:06:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用Python查找数据集中分类列和数字列之间的相关性,有人能帮忙吗?
这是我的数据。 先谢谢你

^{tb1}$

Tags: 数据分类数字tb1
3条回答

这里的相关性感觉有点错误,但我想你可以将状态分解

假设您的数据位于数据帧df中:

from pandas import factorize

labels, categories = factorize(df["Light_Sensor_Status"])
df["labels"] = labels
abs(df["Light_Sensor_Reading"].corr(df["labels"]))

相关性应该为您提供一个值0.9998202098949396

如果两个变量不是定量的,那么计算它们之间的相关性并不意味着什么

我想你要做的是研究它们之间的联系

目的是通过模型解释第一个变量和另一个变量

你可以使用逻辑回归

但你只会知道这两个变量之间是否有联系,这取决于数据的正态性

我会通过绘制数据来检查这一点。颜色必须是水平的

import seaborn as sns
sns.scatterplot(data=df, x=df.index, y='Light_Sensor_Reading', hue='Light_Sensor_Status')

Result of plot

相关问题 更多 >