当一列的条目成为新标签时，按groupby/pivot显示数据

Plant Name,Nameplate Capacity,Technology,... Barry,153.1,Natural Gas Steam Turbine,.. Barry,153.1,Natural Gas Steam Turbine,.. Barry,403.7,Conventional Steam Coal,.. Barry,788.8,Conventional Steam Coal,.. Barry,195.2,Natural Gas Fired Combined Cycle,.. Barry,195.2,Natural Gas Fired Combined Cycle,..

2条回答

网友

1楼 · 编辑于 2024-06-07 15:52:05

我认为需要更改列名并添加参数fill_value：

res = df.pivot_table(index="Plant Name", 
                     columns="Technology", 
                     values="Nameplate Capacity", 
                     aggfunc=np.sum,
                     fill_value=0).reset_index()
print (res)
Technology Plant Name  Conventional Steam Coal  \
0               Barry                   1192.5   

Technology  Natural Gas Fired Combined Cycle  Natural Gas Steam Turbine  
0                                      390.4                      306.2

第一个解决方案应该用指定列来更改aggreatesum和^{}来更改reformate：

res = (df.groupby(['Plant Name', 'Technology'])['Nameplate Capacity']
         .sum()
         .unstack(fill_value=0)
         .reset_index())
print (res)
Technology Plant Name  Conventional Steam Coal  \
0               Barry                   1192.5   

Technology  Natural Gas Fired Combined Cycle  Natural Gas Steam Turbine  
0                                      390.4                      306.2

网友

2楼 · 编辑于 2024-06-07 15:52:05

参数未对齐到pd.pivot_table。列表示类别标签，而值表示要聚合的数据。你知道吗

此外，您应该使用'sum'而不是np.sum，因为Pandas经过优化，可以在给定字符串输入的情况下使用适当的alogrithms：

res = df.pivot_table(index='Plant Name', columns='Technology',
                     values='Nameplate Capacity', aggfunc='sum')

print(res)

Technology  Conventional Steam Coal  Natural Gas Fired Combined Cycle  \
Plant Name                                                              
Barry                        1192.5                             390.4   

Technology  Natural Gas Steam Turbine  
Plant Name                             
Barry                           306.2

另一个问题

相关问题更多 >

编程相关推荐

热门问题

热门文章