我有一个包含个人和日期的时间序列数据集。我想创建一个虚拟变量“newpers”,它第一次假设值为1,按时间顺序,id显示在数据集中。例如,如果简化的数据集如下所示:
personid yearmo
1 2004-05-01
1 2004-06-01
2 2004-05-01
2 2004-06-01
我想做的是:
personid yearmo newpers
1 2004-05-01 1
1 2004-06-01 0
2 2004-05-01 1
2 2004-06-01 0
抱歉,如果这很简单,但我一直在兜圈子,我被难住了。我一直在试着对每个人进行分组/排序,以确定他们的第一次约会。伪变量可以是newpers=(yearmo==firstmo)
,但我似乎无法让groupby/sort不抛出错误。你知道吗
我将使用
shift
方法在数据帧中向后看:这应该有效(假设按personid、yearmo排序)
相关问题 更多 >
编程相关推荐