“成对词提取器”正则表达式

import re read = open("sample.txt", "r") regex = re.compile('(?:\S+\s)?\S*and\S*(?:\s\S+)?') f=open('write.txt','w') for line in read: words = regex.findall(line) for word in words: f.write(str(word)+'\n') f.close()

2条回答

网友

1楼 · 编辑于 2024-05-23 19:47:24

你可以试试这个：

\w+(?=\sand\s)|(?<=\sand\s)\w+

即：

一些单词（\w+）只在它前面的地方匹配了一个肯定的前瞻断言，或者
一些work（\w+）只在\sAnd\s之后匹配，并且在断言后面有一个积极的外观

正lookback需要一个固定长度的字符串，因此您不能执行(?<=\s+and\s+)，因此此解决方案假设所有间距都是单个空格。你知道吗

Tested在regex101.com

编辑

关于问题中的更新，您可以尝试将某物和某物作为一个三字短语：

\w+(?:\s+and\s+)\w+

Tested此输出：

网友
2楼 · 编辑于 2024-05-23 19:47:24

你把事情弄得更复杂了。只需使用以下正则表达式：
\S+\sand\s\S+
See it in action
问题是您在and周围添加的\S*。它匹配“and”周围任意数量的非空白字符，这将匹配“brandy”之类的词。你知道吗

编辑

相关问题更多 >

编程相关推荐

热门问题

热门文章