基于其他行和列的多个条件在dataframe中创建新列？包括空的行？Python/Pandas

df['SPOTTED'] = np.where((df['Work_Date'].notnull()) & (df['Time_Code'] == 'WRK'), 'No', ' ') df['SPOTTED'] = np.where((df['Work_Date'].notnull()) & (df['Time_Code'] == 'OFF'), 'No', ' ') df['SPOTTED'] = np.where((df['Work_Date'].notnull()) & (df['Time_Code'] == 'VAT'), 'No', ' ')

1条回答

网友

1楼 · 发布于 2024-06-16 11:40:32

您共享的分配多个值的代码不起作用的原因是df['SPOTTED'] =分配给整个列。因此，代码会不断创建和覆盖同一列。你知道吗

下次遇到排序问题时，请尝试在每次操作后查看df的内容。你知道吗

我相信这是最惯用的解决办法。我偷了@Henry Yik的虚拟数据，希望他们不会介意。你知道吗

import numpy as np
import pandas as pd

df = pd.DataFrame({'work_date': [1, 2, 3, 4, np.nan], 'time_code': ['WRK', 'OFF', 'VAT', 'BONUS', 'OT15']})

select_time_codes = ['VAT', 'WRK', 'OFF']

df.loc[df['work_date'].notna() & df['time_code'].isin(select_time_codes), 'spotted'] = 'No'

这就是数据帧之后的样子：

   work_date time_code spotted
0        1.0       WRK      No
1        2.0       OFF      No
2        3.0       VAT      No
3        4.0     BONUS     NaN
4        NaN      OT15     NaN

值被指定为字符串'No'，而NaN则保持不变，等待您对可能的值及其用法的说明。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章