在时间序列d中创建新的sumproduct列

2024-04-27 03:59:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在寻找python等价物来对几列数据执行某种计算。你知道吗

这就是我的数据集的头部。你知道吗

          Time  GenA  GenB  GenC  Price
0    1/01/2011   702   367  1355     58
1    2/01/2011   742     0  1013     59
2    3/01/2011   763   322   887     43
3    4/01/2011   558   356   851     50
4    5/01/2011   519   358   677     32
5    6/01/2011   697   154   352     35
6    7/01/2011   782     2   999     52
7    8/01/2011   579    10   493     47
8    9/01/2011   678   313   931     63
9   10/01/2011   595   314   434     34
10  11/01/2011   748   326  1338     72
11  12/01/2011   782   229   503     36
12  13/01/2011   645     3   410     53
13  14/01/2011   800    53   365     40
14  15/01/2011   639    11   123     62
15  16/01/2011   749    75   629     53
16  17/01/2011   625   223   537     38
17  18/01/2011   529    10    47     45
18  19/01/2011   687   192   542     55
19  20/01/2011   727    85   122     31
20  21/01/2011   674   183  1067     67

我想为genA, genB & genC的加权价格添加三列,我可以在excel中这样做,如下所示:

excel

在python中有什么方法可以做到这一点吗?我有一个相当大的数据集,所以这将是伟大的,如果它是可能的。你知道吗


Tags: 数据方法time价格excelprice头部gena
1条回答
网友
1楼 · 发布于 2024-04-27 03:59:17

这应该能奏效

import pandas as pd
import numpy as np

size = 8

#This is to generate a random set, you can use your data instead of this
df = pd.DataFrame(
    data=np.random.randint(1,10,(20,5)),
    index=np.arange(20),
    columns=['Time', 'GenA', 'GenB', 'GenC', 'Price']
    )

max_size = df.shape[0]

for a in ['A','B','C']:
    e = 'Gen' + a + '_W'
    df[e] = np.empty(max_size)
    for i in range(max_size-size):
        df[e][i] = np.average(df['Price'][i:i+size], weights=df['Gen'+a][i:i+size])

也许有一个更“熊猫本地”的方式做这件事,但我已经习惯了numpy的方式。希望能有所帮助

相关问题 更多 >