使用2列的累计和

index lodgement_year words sum cum_sum 0 2000 the 14 14 1 2000 australia 10 10 2 2000 word 12 12 3 2000 brand 8 8 4 2000 fresh 5 5 5 2001 the 8 22 6 2001 australia 3 13 7 2001 banana 1 1 8 2001 brand 7 15 9 2001 fresh 1 6

2条回答

网友

1楼 · 编辑于 2024-04-26 20:45:49

你快到了，伊恩！在

cumsum()方法计算Pandas列的累计和。您正在查找应用于分组words的。因此：

In [303]: df_2['cumsum'] = df_2.groupby(['words'])['sum'].cumsum()

In [304]: df_2
Out[304]: 
   index  lodgement_year      words  sum  cum_sum  cumsum
0      0            2000        the   14       14      14
1      1            2000  australia   10       10      10
2      2            2000       word   12       12      12
3      3            2000      brand    8        8       8
4      4            2000      fresh    5        5       5
5      5            2001        the    8       22      22
6      6            2001  australia    3       13      13
7      7            2001     banana    1        1       1
8      8            2001      brand    7       15      15
9      9            2001      fresh    1        6       6

如果这在你的更大的数据集上失败了，请评论，我们将研究一个可能更精确的版本。在

网友

2楼 · 编辑于 2024-04-26 20:45:49

如果我们只需要考虑“words”列，我们可能需要遍历单词的唯一值

for unique_words in df_2.words.unique():
    if 'cum_sum' not in df_2:
        df_2['cum_sum'] = df_2.loc[df_2['words'] == unique_words]['sum'].cumsum()
    else:
        df_2.update(pd.DataFrame({'cum_sum': df_2.loc[df_2['words'] == unique_words]['sum'].cumsum()}))

上述结果将导致：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用2列的累计和

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >