数据帧转置不相关?

2024-05-23 22:45:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在开发一个CSV,包含不同音乐艺术家的收视率,我正在使用pandas将其转换为数据帧进行关联。问题是,当我转置数据帧并在其上使用.corr()函数时,它返回一个空的数据帧,而转置的相关性正是我需要的。你知道它为什么这么做吗?这是我的代码:

import pandas as pd
musicRatingsFile = "https://raw.githubusercontent.com/aportell/machine-learning/master/MusicRatings.csv"
musicRatingsData = pd.read_csv(musicRatingsFile)
df = DataFrame(musicRatingsData)
df2 = df.dropna()
df3 = df2.transpose()
df3.corr()

Tags: csv数据函数pandasdf音乐pddf2
1条回答
网友
1楼 · 发布于 2024-05-23 22:45:39

您有一个由字符串组成的列(您可能希望该列作为索引),还有两个列被视为对象,即使它们是数字。您可以用以下方法解决:

cor = df2.set_index('student').astype('float').T.corr()

cor.head()
Out: 
student             Colton     Bryce  Mikaela Goldrich  Joe Goulet  \
student                                                              
Colton            1.000000 -0.467859         -0.083099   -0.195272   
Bryce            -0.467859  1.000000          0.008893    0.391781   
Mikaela Goldrich -0.083099  0.008893          1.000000    0.341112   
Joe Goulet       -0.195272  0.391781          0.341112    1.000000   
Trevor Martineau  0.174185  0.444854         -0.175762    0.266465  

.T这里接受转置。在

相关问题 更多 >