选择带regex的term的连字符或非连字符版本

2024-05-16 12:40:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试构建一个python脚本,用BeautifulSoup在网页中查找单词/术语。我想让用户在一个术语中输入连字符或非连字符的版本,并检查两者,例如“数据驱动”也检查“数据驱动”

如果我有这段文字:

Slaying the ‘old school’ bosses with data-driven platforms.

Slaying the ‘old school’ bosses with data driven platforms.

以及正则表达式:

(.+(\W(data((-)|(\s))driven)\W).+)

然后它只捕获带连字符的版本,而不捕获不带连字符的版本

如何修改它才能工作?我正在http://regexr.com/上看


Tags: the数据版本脚本datawith字符old
1条回答
网友
1楼 · 发布于 2024-05-16 12:40:05

您的模式同时捕获连字符和非连字符,那么问题是什么?我不知道你的模式的原因,但我觉得太复杂了。这个简单的怎么样

data[- ]driven

相关问题 更多 >