分析列表列表中的项目，三人一组，并在阅读框之间提取片段。（又名DNA外显子转录）

gene_1= 'A','C','G','G','A','C','T','A','T','T','C' gene_2= 'G','G','C','C','A','T','G','A','G','T','A','A','C','G','C','A','T','A','G','G','G','C','C','C' gene_3='G','G','G','C','C','C','A','T','G','A','C','G','T','A','C','T','A','G','G','G','G','C','C','C','A','T','G','C','A','T','T','C','A','T','A','G' genelist.append(gene_1) genelist.append(gene_2) genelist.append(gene_3) def transcription(ORF): mRNA= '' for i in range(0, len(ORF), 3): codon= ORF[i:i+3] if codon != 'ATG': next(codon) if codon == 'ATG': mRNA=codon.transcribe() if codon == 'TAG': break return(mRNA) mRNAs=[] for gene in genelist: for codon in gene: mRNA= transcription(codon) mRNAs.append(mRNA) print(mRNAs)

2条回答

网友

1楼 · 编辑于 2024-05-23 18:33:07

谢谢大家的评论，我去了生物信息学部分，得到了@terdon的帮助。这是我在问题中描述的最基本的方法，但是，请注意，如果有人试图找到ORF并转录基因，在使用python的程序中，需要考虑一些生物学规则，并且应该考虑读取和终止密码，但是，这只是一个如何开始构建代码的示例：另外，请注意，此代码使用biopython

从生物序列导入序列从Bio.Seq导入转录

genelist=[]

gene_1= 'A','C','G','G','A','C','T','A','T','T','C'
gene_2= 'G','G','C','C','A','T','G','A','G','T','A','A','C','G','C','A','T','A','G','G','G','C','C','C'
gene_3='G','G','G','C','C','C','A','T','G','A','C','G','T','A','C','T','A','G','G','G','G','C','C','C','A','T','G','C','A','T','T','C','A','T','A','G'

genelist.append(gene_1)
genelist.append(gene_2)
genelist.append(gene_3)

def transcription(ORF):
    mRNA= ''
    foundStart = False
    foundEnd = False
    for i in range(0, len(ORF), 3):
        codon= "".join(ORF[i:i+3])
        if codon == 'ATG' and not foundStart:
            foundStart = True
        if foundStart and not foundEnd:
            cc=transcribe(codon)
            mRNA = mRNA + transcribe(codon)
        if codon == 'TAG':
            foundEnd = True
       
    return(mRNA)

mRNAs=[]
for gene in genelist:
    mRNA = transcription(gene)
    mRNAs.append(mRNA)
print(mRNAs)

网友

2楼 · 编辑于 2024-05-23 18:33:07

与其列出每种氨基酸，不如试着把基因变成一个字符串，然后用正则表达式找到起始和结束位点？基因3不是一个多顺反子基因，而不是一个带有外显子的基因吗

大概是这样的：

import re

gene = 'GGGCCCATGACGTACTAGGGGCCCATGCATTCATAG'

rna = re.findall('ATG(.+?(?=TAG))', gene)

相关问题更多 >

编程相关推荐

热门问题

热门文章