Python：从fasta格式的序列开头删除字符

网友

1楼 · 编辑于 2024-05-16 23:02:03

with open('fasta_file') as f:
    for line in f:
        if not line.startswith('>'):
            print line[17:]

网友

2楼 · 编辑于 2024-05-16 23:02:03

如果我理解正确的话，您只需要从潜在的多行序列的前17个字符中删除底漆。你问的有点难。是的，有一个简单的解决方案，但在某些情况下可能会失败。在

我的建议是：使用Biopython来执行FASTA文件的解析。直接从教程

from Bio import SeqIO
handle = open("ls_orchid.fasta")
for seq_record in SeqIO.parse(handle, "fasta") :
    print seq_record.id
    print repr(seq_record.seq)
    print len(seq_record)
handle.close()

然后重写序列，删除前17个字母。我现在的机器上没有安装biopython，但是如果你看一下教程，总共只需要15行代码。在

如果你想做硬核，手工做，你必须做这样的事情（从第一张海报，修改）

^{2}$

网友

3楼 · 编辑于 2024-05-16 23:02:03

如果你的文件看起来像

>MCHU - Calmodulin - Human, rabbit, bovine, rat, and chicken
ADQLTEEQIAEFKEAFSLFDKDGDGTITTKELGTVMRSLGQNPTEAELQDMINEVDADGNGTID
FPEFLTMMARKMKDTDSEEEIREAFRVFDKDGNGYISAAELRHVMTNLGEKLTDEEVDEMIREA
DIDGDGQVNYEEFVQMMTAK*

如果你想删除每个序列行的前17个字符，你可以这样做：

^{2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python：从fasta格式的序列开头删除字符

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >