在对groupby执行求和之后保留输出中的列

df = pd.DataFrame([['William', 1, 0, 'T', 0, 1],['James', 0, 1, 'R', 1, 1],['James', 1, 0, 'S', 0, 1],['Dean', 1, 0, 'R', 1, 0],['William', 0, 1, 'S', 0, 0],['James', 0, 0, 'S', 0, 1]],columns=['Name','x1','x2','x3','x4','x5']) Name x1 x2 x3 x4 x5 0 William 1 0 T 0 1 1 James 0 1 R 1 1 2 James 1 0 S 0 1 3 Dean 1 0 R 1 0 4 William 0 1 S 0 0 5 James 0 0 S 0 1

variables = {'x1': 'sum','x2': 'sum','x4': 'sum','x5': 'sum'} filters = {'Option1': df['x3']=='S', 'Option2': df['x3']=='R', 'Option3': (df['x2']==1) | (df['x4']==1) | (df['x5']==1), 'Option4': df['x2']==1, 'Option5': df['x2']==0, 'Option6': df['x5']==1} out = {key: df[f].groupby('Name').agg(variables) for key, f in filters.items()} out = pd.concat(results)

x1 x2 x4 x5 Name Option1 James 1 0 0 2 William 0 1 0 0 Option2 Dean 1 0 1 0 James 0 1 1 1 Option3 Dean 1 0 1 0 James 1 1 1 3 William 1 1 0 1 Option4 James 0 1 1 1 William 0 1 0 0 Option5 Dean 1 0 1 0 James 1 0 0 2 William 1 0 0 1 Option6 James 1 1 1 3 William 1 0 0 1

x1 x2 x4 x5 Name Option2 Dean 1 0 1 0 Option3 Dean 1 0 1 0 Option5 Dean 1 0 1 0 x1 x2 x4 x5 Name Option1 James 1 0 0 2 Option2 James 0 1 1 1 Option3 James 1 1 1 3 Option4 James 0 1 1 1 Option5 James 1 0 0 2 Option6 James 1 1 1 3 x1 x2 x4 x5 Name Option1 William 0 1 0 0 Option3 William 1 1 0 1 Option4 William 0 1 0 0 Option5 William 1 0 0 1 Option6 William 1 0 0 1

x1 x2 x4 x5 Name James Option1 1 0 0 2 Option2 0 1 1 1 Option3 1 1 1 3 Option4 0 1 1 1 Option5 1 0 0 2 Option6 1 1 1 3 Dean Option1 0 0 0 0 Option2 1 0 1 0 Option3 1 0 1 0 Option4 0 0 0 0 Option5 1 0 1 0 Option6 0 0 0 0 William Option1 0 1 0 0 Option2 0 0 0 0 Option3 1 1 0 1 Option4 0 1 0 0 Option5 1 0 0 1 Option6 1 0 0 1

1条回答

网友

1楼 · 发布于 2024-04-26 04:57:10

您可以通过重新索引out数据帧并交换索引的级别来完成所需的操作。从连接的结果开始：

from itertools import product

# Swap the index levels
out = out.swaplevel(0,1)

# Form the product of the two index levels
ids = list(product(out.index.get_level_values(0).unique(), 
                   out.index.get_level_values(1).unique()))

# Reindex out, filling missing with 0 and sorting the index
out = out.reindex(ids).fillna(0).sort_index().astype('int')

out现在是：

                 x1  x2  x4  x5
Name                           
Dean    Option1   0   0   0   0
        Option2   1   0   1   0
        Option3   1   0   1   0
        Option4   0   0   0   0
        Option5   1   0   1   0
        Option6   0   0   0   0
James   Option1   1   0   0   2
        Option2   0   1   1   1
        Option3   1   1   1   3
        Option4   0   1   1   1
        Option5   1   0   0   2
        Option6   1   1   1   3
William Option1   0   1   0   0
        Option2   0   0   0   0
        Option3   1   1   0   1
        Option4   0   1   0   0
        Option5   1   0   0   1
        Option6   1   0   0   1

相关问题更多 >

编程相关推荐

热门问题

热门文章