我有这样一个数据帧:
import pandas as pd
import numpy as np
df = pd.DataFrame([['WY','M',2014,'Seth',5],
['WY','M',2014,'Spencer',5],
['WY','M',2014,'Tyce',5],
['NY','M',2014,'Seth',25],
['MA','M',2014,'Spencer',23]],columns = ['state','sex','year','name','number'])
print df
如何操作数据以获得如下数据帧:
df1 = pd.DataFrame([['M',2014,'Seth',30],
['M',2014,'Spencer',28],
['M',2014,'Tyce',5]],
columns = ['sex','year','name','number'])
print df1
这只是一个非常大的数据帧的一部分,我该如何为每年的每个名字都这样做?你知道吗
从左到右简要描述一下它的作用:
df.drop('state',axis=1)
替换这个部分number
)。你知道吗['sex','year','name']
不再是索引的一部分。你知道吗按所需列分组,求和
number
,并展平多索引:在您的例子中,
state
列不能求和,因此您可以缩短为:可以使用透视表
相关问题 更多 >
编程相关推荐