2024-04-26 07:19:23 发布
网友
我有大约500个fasta格式的蛋白质序列,我从blastp搜索中得到。从这些序列中,我需要有蛋白质名称,有机体,Uniprot ID,如果可能的话还有蛋白质家族,这样我就可以用这些信息建立一个表格。在
我有没有办法用python来做呢?一些与Uniprot通信的功能?如何解析来自fasta头的信息?在
您应该看看拥有FASTA解析器的Biopython。解析之后,您可以使用pandasDataFrame来构建一个表。如果没有一个示例数据片段,很难提供更全面的答案,但是用大约5行代码应该是可行的:)
DataFrame
from Bio import SeqIO with open("example.fasta", "rU") as handle: print list(SeqIO.parse(handle, "fasta"))
您应该看看拥有FASTA解析器的Biopython。解析之后,您可以使用pandas
DataFrame
来构建一个表。如果没有一个示例数据片段,很难提供更全面的答案,但是用大约5行代码应该是可行的:)相关问题 更多 >
编程相关推荐