从fasta序列创建表格,python
我有大约500个蛋白质序列,都是从blastp搜索中得到的,格式是fasta。我需要从这些序列中提取出蛋白质名称、所属生物、Uniprot ID,以及如果可以的话,还想知道蛋白质家族的信息,这样我就可以把这些信息整理成一个表格。
请问有没有什么方法可以用Python来实现这个?有没有什么函数可以和Uniprot进行沟通?我该如何从fasta的头部信息中提取这些信息呢?
我有大约500个蛋白质序列,都是从blastp搜索中得到的,格式是fasta。我需要从这些序列中提取出蛋白质名称、所属生物、Uniprot ID,以及如果可以的话,还想知道蛋白质家族的信息,这样我就可以把这些信息整理成一个表格。
请问有没有什么方法可以用Python来实现这个?有没有什么函数可以和Uniprot进行沟通?我该如何从fasta的头部信息中提取这些信息呢?