有没有更好/更有效的方法（矢量化）？非常慢的性能

df['SMA'] = df.apply(SMA, axis=1) def SMA(row): Subset = df[(df['group']==row['group'])&(df['t']<=row['t'])].reset_index() Subset2 = Subset[len(Subset.index)-(2):len(Subset.index)] return df['val'].mean()

t group val moving average 1 A 1 NA 2 A 2 1.5 3 A 3 2.5 1 B 4 NA 2 B 5 4.5 3 B 6 5.5 1 C 7 NA 2 C 8 7.5 3 C 9 8.5

1条回答

网友

1楼 · 发布于 2024-04-26 10:44:22

{pandas}在cd1操作中被处理为组。如果我们注意将索引设置为time，那么它还可以处理返回time索引的正确输出。你知道吗

下面是一个与您的代码基本相同的示例：

df = pandas.DataFrame(
   [[1, 'A', 1], 
    [2, 'A', 2], 
    [3, 'A', 3], 
    [1, 'B', 4], 
    [2, 'B', 5], 
    [3, 'B', 6], 
    [1, 'C', 7], 
    [2, 'C', 8], 
    [3, 'C', 9]],
    columns=['t', 'group', 'val'])

df = df.set_index('t')
moving_avg = df.groupby('group').rolling(2).mean()

moving_avg现在是一个新的数据帧。请注意，因为我在第一部分中将索引设置为t，所以在分组和滚动平均中它得到了正确的处理：

         val
group t     
A     1  NaN
      2  1.5
      3  2.5
B     1  NaN
      2  4.5
      3  5.5
C     1  NaN
      2  7.5
      3  8.5

相关问题更多 >

编程相关推荐

热门问题

热门文章