如何按id对列重新采样

id date value 1 16-12-1 9 1 16-12-1 8 1 17-1-1 18 2 17-3-4 19 2 17-3-4 20 1 17-4-3 21 2 17-7-13 12 3 17-8-9 12 2 17-9-12 11 1 17-11-12 19 3 17-11-12 21

2条回答

网友

1楼 · 编辑于 2024-05-19 01:48:52

更新的尝试

如果你想每年重新抽样，那么这是我的尝试，但产量看起来不像你期望的答案

生成数据

d = [['id', 'date', 'value'],
    [1, '2016-12-1', 9],
    [1, '2016-12-1',8],
    [1, '2017-1-1',18],
    [2, '2017-3-4',19],
    [2, '2017-3-4',20],
    [1,'2017-4-3',21],
    [2, '2017-7-13',12],
    [3, '2017-8-9',12],
    [2, '2017-9-12',11],
    [1, '2017-11-12',19],
    [3, '2017-11-12',21],]
df = pd.DataFrame(d[1:], columns=d[0])

print(df)
    id        date  value
0    1   2016-12-1      9
1    1   2016-12-1      8
2    1    2017-1-1     18
3    2    2017-3-4     19
4    2    2017-3-4     20
5    1    2017-4-3     21
6    2   2017-7-13     12
7    3    2017-8-9     12
8    2   2017-9-12     11
9    1  2017-11-12     19
10   3  2017-11-12     21

尝试每年重新取样，然后加和

^{pr2}$

初始答案

您可以这样做，但它不执行显式的resample操作

f = {'date':['min','max'],
    'value':'sum'}
df_grouped = df.groupby(['id']).agg(f)
df_grouped.columns = ['_'.join(col) for col in df_grouped.columns.values]
df_grouped.reset_index(drop=False, inplace=True)

print(df_grouped)
   id  date_min date_max  value_sum
0   1   16-12-1   17-4-3         75
1   2    17-3-4  17-9-12         62
2   3  17-11-12   17-8-9         33

网友

2楼 · 编辑于 2024-05-19 01:48:52

按id列出的周总和：

df['date'] = pd.to_datetime(df['date'], format='%y-%m-%d')
df = df.set_index('date')
df.groupby('id').resample('W')['value'].agg('sum').loc[lambda x: x>0]

输出：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何按id对列重新采样

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >