我需要一个正则表达式,当从tex中提取单词时,它将处理撇号

2024-04-20 08:57:38 发布

您现在位置:Python中文网/ 问答频道 /正文

有人知道在使用正则表达式从文本中提取单词时处理撇号的方法吗?在

>>> import re
>>> s = re.compile(r"\b[A-Za-z0-9_\-]+\b")
>>> s.findall("I don't know Sally's 'special' friend.")
['I', 'don', 't', 'know', 'Sally', 's', 'special', 'friend']

期望结果:

^{pr2}$

This discussion介绍如何查找整个单词,但不处理撇号。在


Tags: 方法文本importrefriend单词sallyspecial
1条回答
网友
1楼 · 发布于 2024-04-20 08:57:38
s = re.compile(r"(?:^|(?<=\s))[A-Za-z0-9_'\-]+(?=\s|$|\b)")

用这个代替\blookarounds将适用于你。看到了吗演示。在

https://regex101.com/r/sS2dM8/25

相关问题 更多 >