为什么在创建具有pd.数据帧（）并手动设置索引？

df = pd.DataFrame(np.random.rand(4,4), columns = ['A', 'B', 'AB', 'O']) df Out[1]: A B AB O 0 0.704744 0.032988 0.514788 0.405281 1 0.978119 0.354312 0.273255 0.908691 2 0.653161 0.337653 0.309225 0.008059 3 0.023022 0.110995 0.751048 0.088853

1条回答

网友

1楼 · 发布于 2024-04-19 05:23:05

如果您传递一个dataframe作为DataFrame构造函数的第一个参数，它将用给定的索引构造一个新的dataframe，并且从原始dataframe赋值，因为该索引有值。你知道吗

例如，如果你写：

pd.DataFrame(df[['B','AB']],index=[0,2])

它将选择第一行和第三行：

          A         B        AB         O
0  0.501622  0.422913  0.570804  0.507912
1  0.507934  0.698122  0.745761  0.201501
2  0.333501  0.567291  0.472924  0.813184
3  0.788795  0.733176  0.843651  0.603158
>>> pd.DataFrame(df[['B','AB']],index=[0,2])
          B        AB
0  0.422913  0.570804
2  0.567291  0.472924

因为没有浮点数的值（就像你的问题0.704744），它将用NaN填充缺少的值

不过，您可以通过以下方式轻松获得所需：

>>> df[['A', 'B', 'AB']].set_index('A')
                 B        AB
A                           
0.501622  0.422913  0.570804
0.507934  0.698122  0.745761
0.333501  0.567291  0.472924
0.788795  0.733176  0.843651

相关问题更多 >

编程相关推荐

热门问题

热门文章

为什么在创建具有pd.数据帧（）并手动设置索引？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >