2024-03-29 08:06:02 发布
网友
我正在使用Python查找数据集中分类列和数字列之间的相关性,有人能帮忙吗? 这是我的数据。 先谢谢你
这里的相关性感觉有点错误,但我想你可以将状态分解
假设您的数据位于数据帧df中:
df
from pandas import factorize labels, categories = factorize(df["Light_Sensor_Status"]) df["labels"] = labels abs(df["Light_Sensor_Reading"].corr(df["labels"]))
相关性应该为您提供一个值0.9998202098949396
0.9998202098949396
如果两个变量不是定量的,那么计算它们之间的相关性并不意味着什么
我想你要做的是研究它们之间的联系
目的是通过模型解释第一个变量和另一个变量
你可以使用逻辑回归
但你只会知道这两个变量之间是否有联系,这取决于数据的正态性
我会通过绘制数据来检查这一点。颜色必须是水平的
import seaborn as sns sns.scatterplot(data=df, x=df.index, y='Light_Sensor_Reading', hue='Light_Sensor_Status')
这里的相关性感觉有点错误,但我想你可以将状态分解
假设您的数据位于数据帧
df
中:相关性应该为您提供一个值
0.9998202098949396
如果两个变量不是定量的,那么计算它们之间的相关性并不意味着什么
我想你要做的是研究它们之间的联系
目的是通过模型解释第一个变量和另一个变量
你可以使用逻辑回归
但你只会知道这两个变量之间是否有联系,这取决于数据的正态性
我会通过绘制数据来检查这一点。颜色必须是水平的
相关问题 更多 >
编程相关推荐