重复正则表达式的一部分?

2024-04-18 10:24:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我要分析电子表格的文本转储。我有一个正则表达式可以正确地解析每一行数据,但它相当长。基本上就是匹配某个模式12或13次。

我想重复的模式是

\s+(\w*\.*\w*);

这是正则表达式(缩写)

^\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);\s+(\w*\.*\w*);

有没有一种方法可以将一个模式匹配一组次数而不必像这样粘贴副本?每个部分都对应于数据列,所有这些都是我需要的。顺便说一下,我用的是Python。谢谢!


Tags: 数据方法文本粘贴模式副本次数电子表格
2条回答

如何使用:

(\s+(\w*\.*\w*);)*

找到findall方法了吗?或者考虑在;拆分?

map(lambda x: x.strip(), s.split(";"))

可能是你真正想要的。

(\s+(\w*\.*\w*);){12}

{n}是“重复n次”

如果你想“12-13”次

(\s+(\w*\.*\w*);){12,13}

如果你想要“12+”次

(\s+(\w*\.*\w*);){12,}

相关问题 更多 >