计算矩阵与其转置的相关性

2024-05-08 15:29:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用apply计算矩阵(这里是数据帧行)与其转置的相关性

代码如下:

import pandas as pd
from pprint import pprint
d = {'A': [1,0,3,0], 'B':[2,0,1,0], 'C':[0,0,8,0], 'D':[1,0,0,1]}
df = pd.DataFrame(data=d)
df_T = df.T  
corr = df.apply(lambda s: df_T.corrwith(s))

相关变量的所有列都包含NaN项。我想要 我想知道为什么会发生NaN

有人能解释一下吗


Tags: 数据代码fromimportdataframepandasdfdata
1条回答
网友
1楼 · 发布于 2024-05-08 15:29:22

我想你需要^{}

print (df.corr())
          A         B         C         D
A  1.000000  0.492366  0.942809 -0.408248
B  0.492366  1.000000  0.174078  0.301511
C  0.942809  0.174078  1.000000 -0.577350
D -0.408248  0.301511 -0.577350  1.000000

如果需要,您的解决方案需要相同的索引和列值:

df = pd.DataFrame(data=d).set_index(df.columns)
print (df)
   A  B  C  D
A  1  2  0  1
B  0  0  0  0
C  3  1  8  0
D  0  0  0  1

df_T = df.T  

corr = df.apply(lambda s: df_T.corrwith(s))
print (corr)
          A         B         C         D
A -0.866025 -0.426401 -0.816497  0.000000
B       NaN       NaN       NaN       NaN
C  0.993399  0.489116  0.936586 -0.486664
D -0.471405 -0.522233 -0.333333  0.577350

相关问题 更多 >