获取pandas datafram中子组的顺序

df = pd.DataFrame({'Name' : ['Kate', 'John', 'Peter','Kate', 'John', 'Peter'],'Distance' : [23,16,32,15,31,26], 'Time' : [3,5,2,7,9,4]}) df Distance Name Time 0 23 Kate 3 1 16 John 5 2 32 Peter 2 3 15 Kate 7 4 31 John 9 5 26 Peter 2

df2 = df[df['Name'] == 'aaa'].reset_index().reset_index() # I did this just to create an empty data frame with the columns I want for name, row in df.groupby('Name').count().iterrows(): table = df[df['Name'] == name].sort_values('Time').reset_index().reset_index() to_concat = [df2,table] df2 = pd.concat(to_concat) df2.drop('index', axis = 1, inplace = True) df2.columns = ['Order', 'Distance', 'Name', 'Time'] df2

2条回答

网友

1楼 · 编辑于 2024-04-19 00:52:56

In [67]: df = df.sort_values(['Name','Time']) \
                .assign(Order=df.groupby('Name').cumcount())

In [68]: df
Out[68]:
   Distance   Name  Time  Order
1        16   John     5      0
4        31   John     9      1
0        23   Kate     3      0
3        15   Kate     7      1
2        32  Peter     2      0
5        26  Peter     4      1

PS我不确定这是最优雅的方式来做这个。。。在

网友

2楼 · 编辑于 2024-04-19 00:52:56

将^{}与^{}一起使用：

df = df.sort_values(['Name','Time'])
df['Order'] = df.groupby('Name').cumcount()
print (df)

   Distance   Name  Time  Order
1        16   John     5      0
4        31   John     9      1
0        23   Kate     3      0
3        15   Kate     7      1
2        32  Peter     2      0
5        26  Peter     4      1

如果需要第一列，请使用^{}：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章