使用python2.7和regex使用子字符串的开头和结尾(密码子)查找子字符串

2024-04-27 04:50:11 发布

您现在位置:Python中文网/ 问答频道 /正文

(Python2.7)我有一个RNA序列,我试图找到所有以'AUG'开头,以'UAG'或'UGA'或'UAA'结尾的不重叠的子串 这就是我的工作:

import re
sequence = GAUGCAAAAUAAAUGAUGUAAUAA
search = r"^(AUG(.)*(?:UAG|UAA|UGA))" 
regions = re.findall(search, sequence)
print regions

输出应为“augcaaa”和“AUGAUG”。但是我得到了整个地区


Tags: importresearch结尾序列augrnasequence
1条回答
网友
1楼 · 发布于 2024-04-27 04:50:11

看来你需要使用

AUG.*?(?=UAG|UAA|UGA)

this regex demo

详细信息:

  • AUG-匹配AUG
  • .*?-除换行符以外的任何0+字符尽可能少到第一个。。。你知道吗
  • (?=UAG|UAA|UGA)-UAGUAAUGA(这些不是返回值的一部分,因为模式位于零宽度断言的正向前瞻中)。你知道吗

相关问题 更多 >