将单元格值映射或替换为表中相应的字符串值

pid code type note 1 A M alvedon 1 B D pain 1 C M ulcer 2 A M ipren 2 B D hurt 3 A M alvedon 3 B D hurt 3 C M stomach 4 A M ipren 4 B D pain 5 A M ipren 5 B D pain

2条回答

网友

1楼 · 编辑于 2024-05-16 00:35:55

您可以连接，然后像现在这样对代码进行分组，然后转换：

In [9]: df["out"] = (
(df["code"] + "_" + df["type"] + "_" + df["note"]).groupby(df["code"]).transform("first"))

In [10]: df
Out[10]: 
    pid code type     note          out
0     1    A    M  alvedon  A_M_alvedon
1     1    B    D     pain     B_D_pain
2     1    C    M    ulcer    C_M_ulcer
3     2    A    M    ipren  A_M_alvedon
4     2    B    D     hurt     B_D_pain
5     3    A    M  alvedon  A_M_alvedon
6     3    B    D     hurt     B_D_pain
7     3    C    M  stomach    C_M_ulcer
8     4    A    M    ipren  A_M_alvedon
9     4    B    D     pain     B_D_pain
10    5    A    M    ipren  A_M_alvedon
11    5    B    D     pain     B_D_pain

网友

2楼 · 编辑于 2024-05-16 00:35:55

这是一种方式。您可以删除重复项并构建组合格式。然后通过code映射到原始数据帧

df2 = df.drop_duplicates('code')
df2['comb'] = df2['code'] + '_' + df2['type'] + '_' + df2['note']

df['code'] = df['code'].map(df2.set_index('code')['comb'])
df = df[['pid', 'code']]

#     pid         code
# 0     1  A_M_alvedon
# 1     1     B_D_pain
# 2     1    C_M_ulcer
# 3     2  A_M_alvedon
# 4     2     B_D_pain
# 5     3  A_M_alvedon
# 6     3     B_D_pain
# 7     3    C_M_ulcer
# 8     4  A_M_alvedon
# 9     4     B_D_pain
# 10    5  A_M_alvedon
# 11    5     B_D_pain

相关问题更多 >

编程相关推荐

热门问题

热门文章

将单元格值映射或替换为表中相应的字符串值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >