我有一个数据帧data = pd.DataFrame({'date':['25 ugust 2014','14 Auust 2014','27 ugust 2014','18 Marc 2015','03 Jue 2014']})
它当前是一个对象数据类型。我想将其转换为datetime格式,但我无法这样做,因为月份中的字符串脏了
data['date'] = pd.to_datetime(data['date'], format = '%d %B %Y')
什么是清理这些数据的最好、最快的方法,以便我可以将其更改为最新格式?{
下面是一种使用来自
difflib
的SequenceMatcher
的方法:结果
data
:下面是一个使用difflib的想法的草图:
它以字符串形式清除日期,但也可以直接从
d
、m
和y
构造日期时间。应用这是数据帧的一列,这很简单,留给读者作为练习相关问题 更多 >
编程相关推荐