基于多个条件和多个列创建新列

status_1 status_2 status_3 a_accepted_with_comment a_revised c_approved a_accepted_with_comment c_rejected nan a_rejected a_approved nan a_rejected nan nan

status_1 status_2 status_3 final_status a_accepted_with _comment a_revised c_approved approved a_accepted_with_comment c_rejected nan rejected b_rejected a_approved nan revised a_rejected nan nan rejected

2条回答

网友

1楼 · 编辑于 2024-06-16 15:45:13

让我们试试ffill和np.select

s = df.ffill(1).iloc[:,-1]
c1 = s=='c_approved'
c2 = s.isin(['c_rejected','a_rejected'])
c3 = s=='a_approved'
df['new'] = np.select([c1,c2,c3],['approve','rejected','revised'])
df
Out[210]: 
                  status_1    status_2    status_3       new
0  a_accepted_with_comment   a_revised  c_approved   approve
1  a_accepted_with_comment  c_rejected         NaN  rejected
2               a_rejected  a_approved         NaN   revised
3               a_rejected         NaN         NaN  rejected

网友

2楼 · 编辑于 2024-06-16 15:45:13

您可以使用ffill和map来跟踪您的每个标准及其结果

response_rules = {
    "c_approved": "approved",
    "c_rejected": "rejected",
    "a_approved": "revised",
    "a_rejected": "rejected"
}

df["final_status"] = df.ffill(axis=1)["status_3"].map(response_rules)
print(df)
                  status_1    status_2    status_3 final_status
0  a_accepted_with_comment   a_revised  c_approved     approved
1  a_accepted_with_comment  c_rejected         NaN     rejected
2               a_rejected  a_approved         NaN      revised
3               a_rejected         NaN         NaN     rejected

如果有很多规则，更好的设计模式可能是保留一个易于阅读/编辑的字典，将结果映射到每个标准，然后在调用.map之前将其反转

response_rules = {
    "approved": ["c_approved"],
    "rejected": ["c_rejected", "a_rejected"],
    "revised": ["a_approved"]
}
# invert dictionary
inverted_rules = {vv: k for k, v in response_rules.items() for vv in v}

# same as before
df["final_status"] = df.ffill(axis=1)["status_3"].map(inverted_rules)

print(df)
                  status_1    status_2    status_3 final_status
0  a_accepted_with_comment   a_revised  c_approved     approved
1  a_accepted_with_comment  c_rejected         NaN     rejected
2               a_rejected  a_approved         NaN      revised
3               a_rejected         NaN         NaN     rejected



# Just so you can see:
print(inverted_rules) 
{'a_approved': 'revised',
 'a_rejected': 'rejected',
 'c_approved': 'approved',
 'c_rejected': 'rejected'}

相关问题更多 >

编程相关推荐

热门问题

热门文章