Pandas数据框架中SQL查询的等价性

update table_A set dt_of_join = sq.dt_of_join from (select id_emp, max(joining) as dt_of_join from table_B group by id_emp ) as sq where table_A.id_emp = sq.id_emp

Table_A id_emp | dt_of_join 2 | 30-03-2018 4 | 03-04-2018 5 | 04-05-2018 7 | 10-06-2018 12 | 20-07-2018 10 | 09-08-2018 19 | 25-12-2018

Table_A id_emp | dt_of_join 2 | 30-03-2018 4 | 01-01-2019 5 | 21-06-2019 7 | 10-06-2018 12 | 03-02-2019 10 | 09-05-2019 19 | 25-12-2018

3条回答

网友

1楼 · 编辑于 2024-04-26 14:19:17

在将emp\uid设置为这两个中的索引之后，考虑DataFrame.update。你知道吗

final_df = (tbl1_df.set_index('id_emp')
                   .update(tbl2_df.set_index('id_emp'))
           )

网友

2楼 · 编辑于 2024-04-26 14:19:17

您可以将^{}与fillna()一起使用，这对于单列更新来说是一个更快的选择（假设id_emp是一列，如果不是d应该是df2['dt_of_join']）：

d=df2.set_index('id_emp')['dt_of_join']
df1.dt_of_join=df1.id_emp.map(d).fillna(df1.dt_of_join)
print(df1)

   id_emp      dt_of_join
0       2      30-03-2018
1       4      01-01-2019
2       5      21-06-2019
3       7      10-06-2018
4      12      03-02-2019
5      10      09-05-2019
6      19      25-12-2018

网友

3楼 · 编辑于 2024-04-26 14:19:17

为什么不reindex：

>>> df['dt_of_join'] = df2.set_index('id_emp').reindex(df['id_emp']).reset_index()['dt_of_join'].fillna(df['dt_of_join'])
>>> df
   id_emp  dt_of_join
0       2  30-03-2018
1       4  01-01-2019
2       5  21-06-2019
3       7  10-06-2018
4      12  03-02-2019
5      10  09-05-2019
6      19  25-12-2018
>>>

相关问题更多 >

编程相关推荐

热门问题

热门文章