(Python2.7)我有一个RNA序列,我试图找到所有以'AUG'开头,以'UAG'或'UGA'或'UAA'结尾的不重叠的子串
这就是我的工作:
import re
sequence = GAUGCAAAAUAAAUGAUGUAAUAA
search = r"^(AUG(.)*(?:UAG|UAA|UGA))"
regions = re.findall(search, sequence)
print regions
输出应为“augcaaa”和“AUGAUG”。但是我得到了整个地区
Tags:
看来你需要使用
见this regex demo
详细信息:
AUG
-匹配AUG
.*?
-除换行符以外的任何0+字符尽可能少到第一个。。。你知道吗(?=UAG|UAA|UGA)
-UAG
或UAA
或UGA
(这些不是返回值的一部分,因为模式位于零宽度断言的正向前瞻中)。你知道吗相关问题 更多 >
编程相关推荐