2024-04-26 10:40:51 发布
网友
我有一个文本文件,其中包含需要提取的文本集,如下所示:
ITEM A blah blah blah ITEM B bloo bloo bloo ITEM A blee blee blee ITEM B
以下是我目前掌握的工作代码:
我知道我可以使用span、start和end等命令来查找匹配项的文本位置。但我需要做很多次,所以我需要的是:
先谢谢你!我已经转了一段时间了。在
为什么不只是:
with open(fname, 'w') as file: for match in re.finditer(r'Item A(.+?)Item B', subject, re.I): s = match.group(1) if len(s) > 50: file.write(s)
注意:使用标志的实际数值是相当倾斜的,请使用re标志中提供的。在
re
这可以在单个正则表达式中完成:
with open("output.txt", "w") as f: for match in re.finditer(r"(?<=Item\sA)(?:(?!Item\sB).){50,}(?=Item\sB)", subject, re.I): f.write(match.group()+"\n")
这将匹配项目A和项目B之间的内容。或者是否也要匹配分隔符?在
regex解释说:
为什么不只是:
注意:使用标志的实际数值是相当倾斜的,请使用
re
标志中提供的。在这可以在单个正则表达式中完成:
这将匹配项目A和项目B之间的内容。或者是否也要匹配分隔符?在
regex解释说:
^{pr2}$相关问题 更多 >
编程相关推荐