使用字典基于条件的数据帧查找值

| patient_id | delirium_date | delirium_sae | syncope_date | syncope_sae | tia_date | tia_sae | |------------|---------------|--------------|--------------|-------------|------------|---------| | 1 | 01-08-2020 | 1 | | | | | | 1 | 03-08-2020 | 0 | | | | | | 2 | | | 02-08-2020 | 1 | | | | 2 | | | 02-08-2020 | 1 | | | | 3 | | | | | 04-08-2020 | 1 | | 3 | 31-07-2020 | 0 | 01-07-2020 | 0 | 20-07-2020 | 0 | | 3 | 02-08-2020 | 1 | | | | | lookup_dictionary = {'delirium_sae' : 'delirium_date', 'syncope_sae' : 'syncope_date', 'tia_sae' : 'tia_date'}

| patient_id | delirium_date | syncope_date | tia_date | |------------|---------------|--------------|------------| | 1 | 01-08-2020 | | | | 1 | | | | | 2 | | 02-08-2020 | | | 2 | | 02-08-2020 | | | 3 | | | 04-08-2020 | | 3 | | | | | 3 | 02-08-2020 | | |

2条回答

网友

1楼 · 编辑于 2024-05-26 17:44:08

使用^{}根据与字典键关联的列屏蔽与字典值关联的列：

keys, vals = dct.keys(), dct.values()
df1 = df[['patient_id']].join(df[vals].mask(df[keys].eq(0).to_numpy()))

结果:

print(df1)
   patient_id delirium_date syncope_date    tia_date
0           1    01-08-2020          NaN         NaN
1           1           NaN          NaN         NaN
2           2           NaN   02-08-2020         NaN
3           2           NaN   02-08-2020         NaN
4           3           NaN          NaN  04-08-2020
5           3           NaN          NaN         NaN
6           3    02-08-2020          NaN         NaN

网友

2楼 · 编辑于 2024-05-26 17:44:08

为了正确工作，必须匹配字典的所有键和值

Idea是通过字典的键选择所有列，通过1进行比较，并为通过^{}中的dictional值选择的匹配列重命名列：

lookup_dictionary = {'delirium_sae' : 'delirium_date',
                         'syncope_sae'  : 'syncope_date',
                         'tia_sae'      : 'tia_date'}
 

mask = df[list(lookup_dictionary.keys())].eq(1).rename(columns=lookup_dictionary)
print (mask)
   delirium_date  syncope_date  tia_date
0           True         False     False
1          False         False     False
2          False          True     False
3          False          True     False
4          False         False      True
5          False         False     False
6           True         False     False


df = df[['patient_id']].join(df[list(lookup_dictionary.values())].where(mask))
print (df)
   patient_id delirium_date syncope_date    tia_date
0           1    01-08-2020          NaN         NaN
1           1           NaN          NaN         NaN
2           2           NaN   02-08-2020         NaN
3           2           NaN   02-08-2020         NaN
4           3           NaN          NaN  04-08-2020
5           3           NaN          NaN         NaN
6           3    02-08-2020          NaN         NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章