如何针对同一数据帧中第一列的所有相同值提取和比较数据帧中第二列的值?在
我有一个数据框叫“df”:
Name Datetime
Bob 26-04-2018 12:00:00
Claire 26-04-2018 12:00:00
Bob 26-04-2018 12:30:00
Grace 27-04-2018 08:30:00
Bob 27-04-2018 09:30:00
我想在数据框中添加一个新的列df['Id'],这样,对于具有相同名称的用户,如果日期时间值的差异不超过30分钟,则将为他们分配相同的Id值,如果日期时间差大于30分钟,则将为其分配一个不同的Id
我认为可以通过循环迭代来实现,但我不确定如何实现。另外,有没有更好的方法来做这个,因为我有一个庞大的数据集?在
我预期的数据帧输出如下:
^{pr2}$任何帮助都将不胜感激。 谢谢
我认为使用}很简单,如下所示:
groupby
、grouper
和{我将按名称、日期时间对数据帧进行排序,以标识不同的组,然后按原始数据帧顺序为每个组分配一个Id值。在
代码可以是:
正如预期的那样:
^{pr2}$相关问题 更多 >
编程相关推荐