在python中，使用其他variab的过去创建一个新列

df ownerh_team visit_team some_var weak some_var2 score A B 1 1 5 3 C D 2 1 3 3 E F 1 1 1 1 A D 4 38 2 0 B D 2 38 3 0 F E 1 38 1 1

1条回答

网友

1楼 · 发布于 2024-06-16 10:56:52

给定以下数据帧：

df = pd.DataFrame([
    ['A','B',1,1,5,3],
    ['C','D',2,1,3,3],
    ['E','F',1,1,1,1],
    ['A','D',4,2,2,3],
    ['B','D',2,2,3,3],
    ['F','E',1,2,1,1],
    ['A','D',4,3,2,3],
    ['B','D',2,3,3,0],
    ['F','E',1,3,1,1]],
    columns=['ownerh_team','visit_team','some_var','week','some_var2','score'])

  ownerh_team visit_team  some_var  week  some_var2  score
0           A          B         1     1          5      3
1           C          D         2     1          3      3
2           E          F         1     1          1      1
3           A          D         4     2          2      3
4           B          D         2     2          3      3
5           F          E         1     2          1      1
6           A          D         4     3          2      3
7           B          D         2     3          3      0
8           F          E         1     3          1      1

我使用pandas.Dataframe.query过滤数据帧，使用pandas.Dataframe.apply函数有效地迭代数据帧。请尝试以下代码：

def new_var_func(data=df, column='name_var', n_past_weeks=1, score_value= 3):
    df[column] = df.apply(lambda row: len(df[(df.ownerh_team == row.ownerh_team) & 
                                                (df.score == score_value) & 
                                                (df.week >= row.week - n_past_weeks) &
                                                (df.week <= row.week)]), axis=1)
    return df



df = new_var_func(data=df, column='name_var', n_past_weeks=1, score_value=3)

并给出：

  ownerh_team visit_team  some_var  week  some_var2  score  name_var
0           A          B         1     1          5      3         1
1           C          D         2     1          3      3         1
2           E          F         1     1          1      1         0
3           A          D         4     2          2      3         2
4           B          D         2     2          3      3         1
5           F          E         1     2          1      1         0
6           A          D         4     3          2      3         2
7           B          D         2     3          3      0         1
8           F          E         1     3          1      1         0

注意：我认为您还需要对当前一周的结果进行计数，如果您想从计数中排除运行的一周，请将df.week <= row.week替换为df.week < row.week，或者如果我误解了您请求的某些部分，请修改查询

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中，使用其他variab的过去创建一个新列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >