将多索引列附加到DataFram的索引

import pandas as pd import numpy as np df = pd.DataFrame(np.ones((5,5))) col_idx = pd.MultiIndex.from_tuples([('X','a'),('X','b'),('Y','c'),('Y','d'),('Y','e')]) row_idx = ['a1','a2','a3','a4','a5'] df.columns = col_idx df.index = row_idx idx = pd.IndexSlice df.loc[:,idx['Y','d']] = 99 print df.head() X Y a b c d e a1 1 1 1 99 1 a2 1 1 1 99 1 a3 1 1 1 99 1 a4 1 1 1 99 1 a5 1 1 1 99 1 #------------------------------------------------------------------------------------------ df_new = pd.DataFrame(np.ones((5,4))) col_idx = pd.MultiIndex.from_tuples([('X','a'),('X','b'),('Y','c'),('Y','e')]) row_idx = pd.MultiIndex.from_tuples([('a1',99),('a2',99),('a3',99),('a4',99),('a5',99)]) df_new.columns = col_idx df_new.index = row_idx print df_new.head() # this is what df_new should look like. # ('Y','d') got appended to the row index. X Y a b c e a1 99 1 1 1 1 a2 99 1 1 1 1 a3 99 1 1 1 1 a4 99 1 1 1 1 a5 99 1 1 1 1

2条回答

网友

1楼 · 编辑于 2024-04-25 15:21:30

那个DataFrame.set\u索引方法接受一个append关键字参数，因此您可以这样做：

df_new = df.set_index(("Y", "d"), append=True)

如果要添加多个列，只需将它们作为列表提供：

df_new = df.set_index([("Y", "d"), ("Y", "e")], append=True)

网友

2楼 · 编辑于 2024-04-25 15:21:30

可以使用元组表示法来指示多索引列中的一列（并且需要append=True来不替换现有索引）：

In [34]: df.set_index(('Y', 'd'), append=True)
Out[34]:
           X     Y
           a  b  c  e
   (Y, d)
a1 99      1  1  1  1
a2 99      1  1  1  1
a3 99      1  1  1  1
a4 99      1  1  1  1
a5 99      1  1  1  1

如果要删除索引名，可以执行以下操作：

In [42]: df2 = df.set_index(('Y', 'd'), append=True)

In [43]: df2.index.names = [None, None]

In [44]: df2
Out[44]:
       X     Y
       a  b  c  e
a1 99  1  1  1  1
a2 99  1  1  1  1
a3 99  1  1  1  1
a4 99  1  1  1  1
a5 99  1  1  1  1

如果要向索引中添加多列，则必须使用列名称列表（在本例中为元组）：

df.set_index([('Y', 'd'), ('Y', 'e')], append=True)

相关问题更多 >

编程相关推荐

热门问题

热门文章