%他在正则表达式中表现出奇怪的行为

1条回答

网友

1楼 · 发布于 2024-05-23 23:15:07

您需要确保传递的变量被正确转义，以便在regex模式中用作文本。使用re.escape(acro)：

import re
text = "there are many people in the world having colorectal cancer (crc) who also have the depression syndrome (ds)"
acrolen=5
rt=[]
acronym_list = ["(crc)", "(ds)"]
for acro in acronym_list:
    p = r'((?:\w+\W+){1,%d}%s)' %(acrolen, re.escape(acro))
    # Or, use format:
    # p = r'((?:\w+\W+){{1,{0}}}{1})'.format(acrolen, re.escape(acro))
    find_words= re.findall(p, text, re.I)
    for word in find_words:
        rt.append(word)
print rt

参见Python demo

另外，请注意，您不需要用捕获组将整个模式括起来，re.findall如果模式中没有定义捕获组，则将返回匹配值。你知道吗

还建议在定义regex模式时使用原始字符串文本，以避免出现不明确的情况。你知道吗

编程相关推荐

使用Selenium Java查找筛选器窗格“铅笔图标”的元素时出现问题
分布式缓存l2上使用infinispan和hibernate的java连接锁
使用Java的DOM XML API解析XML中的符号和
java是解析和操作字符串的有效方法
java发布NewRelicMeterRegistry时如何过滤仪表
多维数组在java中读取文件后将数据值分组
java如何将httpClient配置为jsoup
java BreakIterator在Android中是如何工作的？
找不到maven GAE类：原因：java。lang.ClassNotFoundException应用程序标识cRedential$AppenginecRedential包装
Jlabel调整java大小

相关问题更多 >

编程相关推荐

热门问题

热门文章

%他在正则表达式中表现出奇怪的行为

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >