如何从csv文件中的多个列创建日期时间/时间戳

1条回答

网友

1楼 · 发布于 2024-04-17 19:14:59

^{}非常方便。假设列的名称恰当，则可以很容易地传入

给定此数据帧：

df = pd.DataFrame([[1973, 3, 1, 6, 740], [1973, 3, 1, 7, 750]],
                  columns=list('ABCDE'))

      A  B  C  D    E
0  1973  3  1  6  740
1  1973  3  1  7  750

^{}如果需要：

df = df.rename(columns={'A': 'year', 'B': 'month', 'C': 'day', 'D': 'hour'})

   year  month  day  hour    E
0  1973      3    1     6  740
1  1973      3    1     7  750

然后调用year、month、day、hour上的pd.to_datetime：

df['new_col'] = pd.to_datetime(df[['year', 'month', 'day', 'hour']])

   year  month  day  hour    E             new_col
0  1973      3    1     6  740 1973-03-01 06:00:00
1  1973      3    1     7  750 1973-03-01 07:00:00

总而言之：

df = pd.DataFrame([[1973, 3, 1, 6, 740], [1973, 3, 1, 7, 750]],
                  columns=list('ABCDE'))

df = df.rename(columns={'A': 'year', 'B': 'month', 'C': 'day', 'D': 'hour'})
df['new_col'] = pd.to_datetime(df[['year', 'month', 'day', 'hour']])

或^{}+^{}而不影响df：

df = pd.DataFrame([[1973, 3, 1, 6, 740], [1973, 3, 1, 7, 750]],
                  columns=list('ABCDE'))

df['new_col'] = pd.to_datetime(
    df[['A', 'B', 'C', 'D']]
        .rename(columns={'A': 'year', 'B': 'month', 'C': 'day', 'D': 'hour'})
)

注意df列A、B、C、D在日期时间调用之外不受影响：

      A  B  C  D    E             new_col
0  1973  3  1  6  740 1973-03-01 06:00:00
1  1973  3  1  7  750 1973-03-01 07:00:00

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从csv文件中的多个列创建日期时间/时间戳

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >