从fasta序列制作表格,使用python

2024-04-26 07:19:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我有大约500个fasta格式的蛋白质序列,我从blastp搜索中得到。从这些序列中,我需要有蛋白质名称,有机体,Uniprot ID,如果可能的话还有蛋白质家族,这样我就可以用这些信息建立一个表格。在

我有没有办法用python来做呢?一些与Uniprot通信的功能?如何解析来自fasta头的信息?在


Tags: 功能名称信息id格式序列蛋白质fasta
1条回答
网友
1楼 · 发布于 2024-04-26 07:19:23

您应该看看拥有FASTA解析器的Biopython。解析之后,您可以使用pandasDataFrame来构建一个表。如果没有一个示例数据片段,很难提供更全面的答案,但是用大约5行代码应该是可行的:)

from Bio import SeqIO
with open("example.fasta", "rU") as handle:
    print list(SeqIO.parse(handle, "fasta"))

相关问题 更多 >