我想确定multifasta文件中各个序列的长度。我从生物手册上得到的生物电话代码是:
from Bio import SeqIO
import sys
cmdargs = str(sys.argv)
for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"):
output_line = '%s\t%i' % \
(seq_record.id, len(seq_record))
print(output_line)
我的输入文件如下:
>Protein1
MNT
>Protein2
TSMN
>Protein3
TTQRT
代码生成:
Protein1 3
Protein2 4
Protein3 5
但是我想计算一个序列的长度加上之前序列的长度。就像:
Protein1 1-3
Protein2 4-7
Protein3 8-12
我不知道代码中的哪一行需要更改才能获得输出。我很感激在这个问题上的任何帮助,谢谢!!!!你知道吗
很容易得到总长度:
要获得范围:
相关问题 更多 >
编程相关推荐