在Python中使用pandas解析YYYYMMDD和HH在单独列中的日期

2条回答

网友

1楼 · 编辑于 2024-05-16 23:43:08

如果将列表传递给index_col，则意味着您希望从列表中的列创建层次索引。

此外，parse_dates关键字可以设置为True或list/dict。如果为True，则尝试将单个列作为日期进行分析，否则将组合列以分析单个日期列。

总之，您要做的是：

from datetime import datetime
import pandas as pd
parse = lambda x: datetime.strptime(x, '%Y%m%d %H')
pd.read_csv("..\\file.csv",  parse_dates = [['YYYYMMDD', 'HH']], 
            index_col = 0, 
            date_parser=parse)

网友

2楼 · 编辑于 2024-05-16 23:43:08

我一直在做这个，所以我测试了不同的速度。我发现的最快速度如下，大约比Chang She的解决方案快3倍，至少在我的情况下，考虑到文件解析和日期解析的总时间：

首先，使用pd.read_csv解析数据文件，而不解析日期。我发现它使文件读起来慢了很多。确保CSV文件的列现在是dataframe df中的列。然后：

format = "%Y%m%d %H"
times = pd.to_datetime(df.YYYYMMDD + ' ' + df.HH, format=format)
df.set_index(times, inplace=True)
# and maybe for cleanup
df = df.drop(['YYYYMMDD','HH'], axis=1)

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中使用pandas解析YYYYMMDD和HH在单独列中的日期

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >