我在Pandas DateFrame
中有一列时区字符串,其中每个字符串条目都是以下内容的变体:
'Local Time Zone (America/Chicago (CST) offset -21600)'
我试图通过apply
调用提取字符串末尾的数字偏移量(以秒为单位):
df['minuteOffset'] = df.timezone.apply(lambda x: int(re.match('.*?offset (-?[0-9]*)\\)', a).group(1)))
然而,当我再看数据帧时,我看到第一个值-21600为所有行结转,即使其他行有其他值。如何在每行的基础上正确提取正则表达式以生成一个新列?为什么上面的操作失败了?
我会这样做:
相关问题 更多 >
编程相关推荐