我正在尝试构建一个python脚本,用BeautifulSoup在网页中查找单词/术语。我想让用户在一个术语中输入连字符或非连字符的版本,并检查两者,例如“数据驱动”也检查“数据驱动”
如果我有这段文字:
Slaying the ‘old school’ bosses with data-driven platforms.
Slaying the ‘old school’ bosses with data driven platforms.
以及正则表达式:
(.+(\W(data((-)|(\s))driven)\W).+)
然后它只捕获带连字符的版本,而不捕获不带连字符的版本
如何修改它才能工作?我正在http://regexr.com/上看
您的模式同时捕获连字符和非连字符,那么问题是什么?我不知道你的模式的原因,但我觉得太复杂了。这个简单的怎么样
相关问题 更多 >
编程相关推荐