有没有一种方法可以执行创建关系数据帧?

2024-04-29 11:08:53 发布

您现在位置:Python中文网/ 问答频道 /正文

由于错误地填充了一个有点掩蔽的数据帧,我正在努力将我的数据帧转换成我需要的格式

我有许多数据帧:

plot_d1_sw1-这是从.csv读取的

            timestamp  switchID    deviceID  count
0 2019-05-01 07:00:00         1  GTEC122277      1
1 2019-05-01 08:00:00         1  GTEC122277      1
3 2019-05-01 10:00:00         1  GTEC122277      3

d1_sw1-这是最后12个小时,是数据是否出现在filt中的条件

             timestamp    num
0  2019-05-01 12:00:00  False
1  2019-05-01 11:00:00  False
2  2019-05-01 10:00:00   True
3  2019-05-01 09:00:00  False
4  2019-05-01 08:00:00   True
5  2019-05-01 07:00:00   True
6  2019-05-01 06:00:00  False
7  2019-05-01 05:00:00  False
8  2019-05-01 04:00:00  False
9  2019-05-01 03:00:00  False
10 2019-05-01 02:00:00  False
11 2019-05-01 01:00:00  False

我尝试过使用以下方法屏蔽此项并将count列拉入anyTrue值:

mask_d1_sw1 = d1_sw1.num == False
d1_sw1.loc[mask_d1_sw1, column_name] = 0

i=0
for row in plot_d1_sw1.itertuples():
    mask_d1_sw1 = d1_sw1.num == True
    d1_sw1.loc[mask_d1_sw1, column_name] = plot_d1_sw1['count'].values[i]
    print(d1_sw1)
    i = i + 1

这给了我:

             timestamp  num
0  2019-05-01 12:00:00    0
1  2019-05-01 11:00:00    0
2  2019-05-01 10:00:00    3
3  2019-05-01 09:00:00    0
4  2019-05-01 08:00:00    3
5  2019-05-01 07:00:00    3
6  2019-05-01 06:00:00    0
7  2019-05-01 05:00:00    0
8  2019-05-01 04:00:00    0
9  2019-05-01 03:00:00    0
10 2019-05-01 02:00:00    0
11 2019-05-01 01:00:00    0

。。。我知道这是因为我在countplot_d1_sw1列中循环,但我一辈子都搞不懂如何逻辑地填充它来得到结果:

             timestamp  num
0  2019-05-01 12:00:00    0
1  2019-05-01 11:00:00    0
2  2019-05-01 10:00:00    3
3  2019-05-01 09:00:00    0
4  2019-05-01 08:00:00    1
5  2019-05-01 07:00:00    1
6  2019-05-01 06:00:00    0
7  2019-05-01 05:00:00    0
8  2019-05-01 04:00:00    0
9  2019-05-01 03:00:00    0
10 2019-05-01 02:00:00    0
11 2019-05-01 01:00:00    0

我怎样才能达到这个结果


Tags: 数据namefalsetrueplotcount错误column
1条回答
网友
1楼 · 发布于 2024-04-29 11:08:53

一种方法是在时间戳上^{},然后将布尔值与count相乘:

df = d1_sw1.merge(plot_d1_sw1, how='left', on='timestamp')
df['num'] = df.num.mul(df['count'].fillna(0)).astype(int)
df[['timestamp', 'num']]

它给出:

         timestamp        num
0   2019-05-01-12:00:00    0
1   2019-05-01-11:00:00    0
2   2019-05-01-10:00:00    3
3   2019-05-01-09:00:00    0
4   2019-05-01-08:00:00    1
5   2019-05-01-07:00:00    1
6   2019-05-01-06:00:00    0
7   2019-05-01-05:00:00    0
8   2019-05-01-04:00:00    0
9   2019-05-01-03:00:00    0
10  2019-05-01-02:00:00    0
11  2019-05-01-01:00:00    0

相关问题 更多 >