我有下面的数据集,包括刷卡和刷卡时间。输出必须是唯一的卡和刷卡日期,即如果一张卡在一天内被多次刷卡,则输出应包含一张卡和第一次扫描的时间。任何关于如何开始使用Python和Pandas的指示都是值得赞赏的
Card No Time
3434 9/17/2018 5:19
3434 9/17/2018 5:57
3456 9/17/2018 5:58
3457 9/17/2018 5:59
3234 9/17/2018 6:00
3457 9/17/2018 6:07
3459 9/17/2018 6:20
3434 9/20/2018 9:35
3434 9/20/2018 9:35
3456 9/20/2018 9:41
3457 9/20/2018 9:41
3234 9/20/2018 9:43
3457 9/20/2018 9:46
3459 9/20/2018 9:46
3434 9/20/2018 9:51
3434 9/20/2018 9:52
3456 9/20/2018 9:52
Output :
Card No Time
3434 9/17/2018
3456 9/17/2018
3457 9/17/2018
3234 9/17/2018
3459 9/17/2018
3434 9/20/2018
3456 9/20/2018
3457 9/20/2018
3234 9/20/2018
3459 9/20/2018
假设您的
Time
列已按Time
排序,如示例所示,如果您希望输出没有所需输出的时间部分,可以尝试以下操作否则,你可以试试我的
groupby
和head
在
card
和date
上尝试groupby()
,并使用idxmin
提取所需的行:输出
也可以使用
drop_duplicates
,但首先需要创建日期:输出:
相关问题 更多 >
编程相关推荐