当我对日期排序时,使用pandas时,一些排序的数据是随机错误的。原因可能是什么?

2024-03-28 09:13:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我从Twitter上获得了这些信息,并想对日期进行排序。但是,有些日期排序不正确,从日期切换到月份,反之亦然。代码或原始数据是否有问题?不过,我的原始数据看起来不错。有人能帮忙吗

原始数据

enter image description here

我的代码

df05 = pd.read_csv("01_clean_2020-07.csv")
df05['date'] = pd.to_datetime(df05['date'], dayfirst=True)
df05_count = df05['date'].dt.date.value_counts().sort_index().reset_index()
df05_count.columns = ['date','count']

输出

date    count
0   2020-03-07  2 **wrong
1   2020-04-07  1 **wrong
2   2020-07-13  5
3   2020-07-15  1
4   2020-07-16  1
5   2020-07-20  1
6   2020-07-21  7
7   2020-07-22  3
8   2020-07-23  3
9   2020-07-24  3
10  2020-07-25  2
11  2020-07-26  1
12  2020-07-28  1
13  2020-07-29  1
14  2020-07-30  1
15  2020-07-31  2
16  2020-09-07  1 *** wrong
17  2020-11-07  6 *** wrong
18  2020-12-07  3 *** wrong

1条回答
网友
1楼 · 发布于 2024-03-28 09:13:49

这里似乎不是第一天,而是第一个月,所以删除dayfirst=True

df05['date'] = pd.to_datetime(df05['date'])

也可以指定格式:

df05['date'] = pd.to_datetime(df05['date'], format='%m/%d/%Y %H:%M')

相关问题 更多 >