将值应用于数据帧而不使用forloop

check1 check2 result 0 True False 1 1 False False 1 2 False False 1 3 False False 1 4 False False 1 5 False False 1 6 False True 2 7 False False 2 8 False True 3 9 False False 3 10 False True 4 11 False False 4 12 False True 5 13 False False 5 14 False True 6 15 False False 6 16 False True 7 17 False False 7 18 False False 7 19 False False 7 20 False True 8 21 False False 8 22 False True 9 23 True False 1 24 False False 1

2条回答

网友

1楼 · 编辑于 2024-06-02 04:31:37

您希望使用前一行的值来迭代数据帧。在这种情况下，最有效的方法是直接迭代底层numpy数组：

df = pd.read_fwf(io.StringIO(t))

df['result'] = df.check1.astype(int)

res = df['result'].values
c1 = df['check1'].values
c2 = df['check2'].values
old = -1
for i in range(len(df)):
    if res[i] != 1:
        res[i] = old + int(c2[i])
    old = res[i]

这很好，因为numpy数组是可变类型，所以更改会反映在数据帧中。你知道吗

Timeit说这个速度是@Chris的原始解决方案的两倍，在@Dan改进后仍然是原来的1.5倍。你知道吗

网友

2楼 · 编辑于 2024-06-02 04:31:37

使用pandas.DataFrame.groupby.cumsum：

import pandas as pd

df['result'] = df.groupby(df['check1'].cumsum())[['check1', 'check2']].cumsum().sum(1)

或者@丹的建议：

df['result'] = df.groupby(df['check1'].cumsum())['check2'].cumsum().add(1)

输出：

    check1  check2  result
0     True   False     1.0
1    False   False     1.0
2    False   False     1.0
3    False   False     1.0
4    False   False     1.0
5    False   False     1.0
6    False    True     2.0
7    False   False     2.0
8    False    True     3.0
9    False   False     3.0
10   False    True     4.0
11   False   False     4.0
12   False    True     5.0
13   False   False     5.0
14   False    True     6.0
15   False   False     6.0
16   False    True     7.0
17   False   False     7.0
18   False   False     7.0
19   False   False     7.0
20   False    True     8.0
21   False   False     8.0
22   False    True     9.0
23    True   False     1.0
24   False   False     1.0

相关问题更多 >

编程相关推荐

热门问题

热门文章