如何将ISO 8601日期时间字符串转换为Python日期时间对象?

614 投票
11 回答
689322 浏览
提问于 2025-04-15 12:07

我收到的日期时间字符串格式像这样:“2009-05-28T16:15:00”(我想这是ISO 8601格式)。一种比较“hack”的方法是用 time.strptime 来解析这个字符串,然后把解析出来的前六个元素传给日期时间的构造函数,像这样:

datetime.datetime(*time.strptime("2007-03-04T21:08:12", "%Y-%m-%dT%H:%M:%S")[:6])

我一直找不到更“干净”的方法来做到这一点。有没有更好的方法呢?

11 个回答

66

因为ISO 8601标准允许有很多可选的冒号和破折号,所以基本的格式是 CCYY-MM-DDThh:mm:ss[Z|(+|-)hh:mm]。如果你想使用strptime这个函数,你需要先去掉这些不同的格式。

我们的目标是生成一个UTC时间对象。


如果你只想处理一个基本的情况,比如带有Z后缀的UTC时间,像 2016-06-29T19:36:29.3453Z,可以使用下面的代码:

datetime.datetime.strptime(timestamp.translate(None, ':-'), "%Y%m%dT%H%M%S.%fZ")

如果你想处理时区偏移,比如 2016-06-29T19:36:29.3453-0400 或者 2008-09-03T20:56:35.450686+05:00,可以使用以下代码。这些代码会把所有不同的格式转换成没有可变分隔符的格式,比如 20080903T205635.450686+0500,这样会更一致,也更容易解析。

import re
# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)
datetime.datetime.strptime(conformed_timestamp, "%Y%m%dT%H%M%S.%f%z" )

如果你的系统不支持 %z 这个strptime指令(你可能会看到类似 ValueError: 'z' is a bad directive in format '%Y%m%dT%H%M%S.%f%z' 的错误),那么你需要手动调整时间,从 Z(UTC)开始。请注意,%z 在Python 3之前的版本可能无法使用,因为它依赖于C库的支持,而这个支持在不同的系统和Python版本中可能会有所不同(比如 JythonCython 等)。

import re
import datetime

# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)

# Split on the offset to remove it. Use a capture group to keep the delimiter
split_timestamp = re.split(r"([+|-])",conformed_timestamp)
main_timestamp = split_timestamp[0]
if len(split_timestamp) == 3:
    sign = split_timestamp[1]
    offset = split_timestamp[2]
else:
    sign = None
    offset = None

# Generate the datetime object without the offset at UTC time
output_datetime = datetime.datetime.strptime(main_timestamp +"Z", "%Y%m%dT%H%M%S.%fZ" )
if offset:
    # Create timedelta based on offset
    offset_delta = datetime.timedelta(hours=int(sign+offset[:-2]), minutes=int(sign+offset[-2:]))

    # Offset datetime with timedelta
    output_datetime = output_datetime + offset_delta
321

从Python 3.7开始,你可以不需要任何外部库,直接使用fromisoformat这个函数,它是在datetime模块里的:

datetime.datetime.fromisoformat('2019-01-04T16:41:24+02:00')

在Python 2中,不支持%z这个格式,所以如果可以的话,最好在所有地方都明确使用Zulu时间:

datetime.datetime.strptime("2007-03-04T21:08:12Z", "%Y-%m-%dT%H:%M:%SZ")
933

我更喜欢使用dateutil这个库来处理时区和解析日期。比如说,如果你拿到一个ISO 8601格式的字符串,比如2010-05-08T23:41:54.000Z,用strptime来解析会挺麻烦的,尤其是你事先不知道这个字符串里有没有时区信息。pyiso8601在使用过程中我遇到了一些问题(可以去他们的跟踪器看看),而且这个库已经好几年没更新了。相比之下,dateutil一直在更新,并且对我来说效果很好:

from dateutil import parser
yourdate = parser.parse(datestring)

撰写回答