我想用python+pandas(previous question)总结一下发电厂的发电能力。你知道吗
对于此任务,数据必须分组/透视,而“技术”列中的列条目应成为列标签
这是我的意见:
Plant Name,Nameplate Capacity,Technology,...
Barry,153.1,Natural Gas Steam Turbine,..
Barry,153.1,Natural Gas Steam Turbine,..
Barry,403.7,Conventional Steam Coal,..
Barry,788.8,Conventional Steam Coal,..
Barry,195.2,Natural Gas Fired Combined Cycle,..
Barry,195.2,Natural Gas Fired Combined Cycle,..
以及所需的输出:
Plant Name,Natural Gas Steam Turbine,Conventional Steam Coal,Natural Gas Fired Combined Cycle,..
Barry,306.2,1192.5,390.4,..
我试过几个命令,但都没有成功:
df.groupby(['Plant Name', 'Technology']).sum().pivot('Plant Name', 'Technology').fillna(0)
或者
#with numpy as np
res = df.pivot_table(index=["Plant Name"], columns=["Plant Name"], values=["Technology"], aggfunc=np.sum)
如何找到每一行作为新列的最大条目(例如我的示例中的“常规动力煤”?你知道吗
我认为需要更改列名并添加参数
fill_value
:第一个解决方案应该用指定列来更改aggreate} 来更改reformate:
sum
和^{参数未对齐到
pd.pivot_table
。列表示类别标签,而值表示要聚合的数据。你知道吗此外,您应该使用
'sum'
而不是np.sum
,因为Pandas经过优化,可以在给定字符串输入的情况下使用适当的alogrithms:相关问题 更多 >
编程相关推荐