假设我有以下数据集
ID | Name | balance | Year
112 Johnstown $321 2020
321 Oregon $214 2020
121 Jackson $254 2020
和以下传入的数据集
112 Johnstown $321 2021
321 Oregon $216 2020
121 Jackson $254 2020
我想做的是结合这两个数据集,同时保留季节性的概念。基本上,如果一条记录的任何字段(年份除外)发生了更改,则更新该记录。然而,如果记录的年份发生了变化,那么就创造一个新的记录
在我们的例子中,结果数据集如下所示
112 Johnstown $321 2021
112 Johnstown $321 2020
321 Oregon $216 2020
121 Jackson $254 2020
这本质上是一个升级操作,我认为这是一个ID和季节组合键上的升级操作。基本上,如果ID和季节相同,则更新现有记录;如果ID和季节不同,则添加新记录。换句话说
3.如果记录不同且年份/id不同 创造新纪录
这在数据帧中可能吗?如果没有,我是否应该考虑另一种结构来实现这一点?我们的数据集只是拼花文件,所以我们可以随意操作它们
这是预期产出吗?基于你的
我们连接两个数据帧,按
ID
和Year
分组,并在每个组中保留最后一个(因此,来自df2
)元素相关问题 更多 >
编程相关推荐