lin开头的可选匹配

2条回答

网友

1楼 · 编辑于 2024-05-23 22:33:23

这似乎有效：

>>> re.findall(r'\B#([^,\W]+)', '#This string cont#ains #four, and #only four #hashtags.')
['This', 'four', 'only', 'hashtags']

\B：匹配空字符串，但仅当它不在单词的开头或结尾时。这意味着r'py\B'匹配'python'，'py3'，'py2'，但不是{}，'py.'，或{}。\B正好与\b相反，因此也受LOCALE和{}的设置的影响。在
\W：如果没有指定LOCALE和UNICODE标志，则匹配任何非字母数字字符；这相当于集合[^a-zA-Z0-9_]。对于LOCALE，它将匹配不在集合[0-9_]中的任何字符，并且对于当前语言环境，它没有定义为字母数字。如果设置了UNICODE，则这将匹配除[0-9_]加上Unicode字符属性数据库中分类为非字母数字的字符之外的任何字符。在

网友

2楼 · 编辑于 2024-05-23 22:33:23

在你的正则表达式之前，你可以告诉你不想要什么。在

(?<!\w)(#[^ \.,]+)

有了消极的眼神你就能做到