因此,我一直在尝试提取文本文件中“点”字符后面的字符串,但仅适用于以下模式的行,即日期和时间之后的行:
2018年5月9日上午10:37•下午6点,珀斯(上午)
问题是,对于每一行,日期和时间都会发生变化,因此唯一常见的模式是在“点”之前有AM或PM。你知道吗
但是,如果我搜索“AM”或“PM”,它将不会识别这些行,因为“AM”和“PM”都附加在时间上。你知道吗
这是我当前的代码:
for i,s in enumerate(open(file)): for words in ['PM','AM']: if re.findall(r'\b' + words + r'\b', s): source=s.split('•')[0]
你知道怎么解决这个问题吗?非常感谢。你知道吗
我想你的正则表达式就是问题所在。你知道吗
如果您试图提取datetime,请尝试使用regex。你知道吗
例如:
输出:
相关问题 更多 >
编程相关推荐