多级切片Pandas数据帧

2024-04-17 22:29:43 发布

男 | 程序猿一只，喜欢编程写python代码。

我有3个数据帧：

import pandas as pd
df1 =  pd.DataFrame( np.random.randn(100,4), index = pd.date_range('1/1/2010', periods=100), columns = {"A", "B", "C", "D"}).T.sort_index()
df2 =  pd.DataFrame( np.random.randn(100,4), index = pd.date_range('1/1/2010', periods=100), columns = {"A", "B", "C", "D"}).T.sort_index()
df3 =  pd.DataFrame( np.random.randn(100,4), index = pd.date_range('1/1/2010', periods=100), columns = {"A", "B", "C", "D"}).T.sort_index()

我将它们串联起来，创建具有多个级别的数据帧：

^{pr2}$

交换级别和排序：

df_c.columns = df_c.columns.swaplevel(0,1)
df_c = df_c.reindex_axis(sorted(df_c.columns), axis = 1)


ipdb> df_c
    2010-01-01                     2010-01-02
     df1       df2       df3        df1       df2       df3
A  -0.798407  0.124091  0.271089   0.754759 -0.575769  1.501942
B   0.602091 -0.415828  0.152780   0.530525  0.118447  0.057240
C  -0.440619 -1.074837 -0.618084   0.627520 -1.298814  1.029443
D  -0.242851 -0.738948 -1.312393   0.559021  0.196936 -1.074277

我想对其进行切片以获取单个行的值，但到目前为止，我只实现了这样一种程度的切片：

cols = df_c.T.index.get_level_values(0)

ipdb> df_c.xs(cols[0], axis = 1, level = 0)
        df1       df2       df3
A -0.798407  0.124091  0.271089
B  0.602091 -0.415828  0.152780
C -0.440619 -1.074837 -0.618084
D -0.242851 -0.738948 -1.312393

我发现获得每个原始值的唯一方法是定义一个新的数据帧

   slcd_df = df_c.xs(cols[0], axis = 1, level = 0)

然后使用常规过程选择行：

  ipdb> slcd_df.ix["A", :]
  df1   -0.798407
  df2    0.124091
  df3    0.271089

但我想知道是否有更好的（意味着更快和更优雅）的方法来分割多级数据帧。在

Tags： columns 数据 dataframe df date index np range

1条回答

网友

1楼 · 发布于 2024-04-17 22:29:43

您可以使用^{}：

idx = pd.IndexSlice
sliced = df_c.loc["A", idx["2010-01-01", :]]
print(sliced)

2010-01-01  df1    0.199332
            df2    0.887018
            df3   -0.346778
Name: A, dtype: float64

或者您也可以使用slice(None)：

^{pr2}$

多级切片Pandas数据帧

相关问题更多 >

编程相关推荐

热门问题

热门文章

多级切片Pandas数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >