在pandas中应用groupby后如何计算列的正数和负数

token name ltp change 0 12345.0 abc 2.0 NaN 1 12345.0 abc 5.0 1.500000 2 12345.0 abc 3.0 -0.400000 3 12345.0 abc 9.0 2.000000 4 12345.0 abc 5.0 -0.444444 5 12345.0 abc 16.0 2.200000 6 6789.0 xyz 1.0 NaN 7 6789.0 xyz 5.0 4.000000 8 6789.0 xyz 3.0 -0.400000 9 6789.0 xyz 13.0 3.333333 10 6789.0 xyz 9.0 -0.307692 11 6789.0 xyz 20.0 1.222222

3条回答

网友

1楼 · 编辑于 2024-06-08 08:27:17

对由^{}添加的新列使用^{}和^{}，然后按^{}计算值：

count=(df.assign(type=np.sign(df['change'])
                      .map({1:'pos_count', -1:'neg_count'}))
        .groupby(df['name'])['type']
        .value_counts()
        .reset_index(name='count'))
print (count)
  name       type  count
0  abc  pos_count      3
1  abc  neg_count      2
2  xyz  pos_count      3
3  xyz  neg_count      2

网友

2楼 · 编辑于 2024-06-08 08:27:17

您可以在df中创建一个符号为change的新列，并按name分组并签名：

import pandas as pd
import numpy as np
df['change_sign'] = np.sign(df['change'])
df.groupby(['name','change_sign']).count()

然后，如果需要以列而不是行的形式显示结果，则可以透视

网友

3楼 · 编辑于 2024-06-08 08:27:17

使用：

g = df.groupby('name')['change']
counts = g.agg(
    pos_count=lambda s: s.gt(0).sum(),
    neg_count=lambda s: s.lt(0).sum(),
    net_count=lambda s: s.gt(0).sum()- s.lt(0).sum()).astype(int)

结果:

# print(counts)
     pos_count  neg_count  net_count
name                                 
abc           3          2          1
xyz           3          2          1

相关问题更多 >

编程相关推荐

热门问题

热门文章