用python正则表达式编译模糊regexp

2024-06-06 14:08:44 发布

您现在位置:Python中文网/ 问答频道 /正文

当我发现pythonregex模块允许模糊匹配时,我越来越高兴,因为它似乎是解决我许多问题的简单方法。 但现在我遇到了一个问题,我没有从文档中找到任何答案。在

如何使用新的fuzziness值特性将字符串编译成regexp?在

来说明我通常的需求并给一个示例一段代码

import regex
f = open('liner.fa', 'r')
nosZ2f='TTCCGACTACCAAGGCAAATACTGCTTCTCGAC'
nosZ2r='AGGTCACATCAACGTCAACG'

#nini=regex.compile(nosZ2r{e<=3})

nimekiri=list(f)
pikkus=len(nimekiri)

count = 0
while (count < pikkus):
    line = nimekiri[count].rstrip('\n')
    m=regex.findall("(TTCCGACTACCAAGGCAAATACTGCTTCTCGAC){e<=3}", line)
    n=regex.findall("AGGTCACATCAACGTCAACG{e<=3}", line) 
    if bool(m) & bool(n):
        print nimekiri[count-1].rstrip('\n')
        print line
    count = count + 1

f.close()

如您所见,带有3个错误模糊性的regexp可以正常工作。但我不得不手动将整个字符串(nosZ2f/r)输入findall。 我无法用error/fuzzynes值编译regexp。在

将字符串(nosZ2f/r行)转换为fuzzynes值为3个错误的regexp模式的正确语法是什么?在第行看到尝试失败(注释)

使用输入字符串作为regexp源的可能性对于我想到的任何实际有用的脚本都是至关重要的。(否则自动化程度不高) 所以如果我能用弗雷克斯,我会很高兴的。更换

^{pr2}$

m=regex.findall(nini, line) etc.

或者

m=regex.findall("string{e<=3}", line)

Tags: 字符串countlineregexboolregexpfindallrstrip
1条回答
网友
1楼 · 发布于 2024-06-06 14:08:44

你需要把你的线正确地放在一起。在

import regex
testString = 'some phrase'
r = regex.compile('('+testString+'){e<=5}')
r.match('phrase')

如果要构建regex模式,则需要使用各种字符串操作技术来构建要使用的适当模式。在

相关问题 更多 >