使用biopython从输出文件中的文件标题打印物种名称(对于多个文件)

2024-03-28 11:35:21 发布

您现在位置:Python中文网/ 问答频道 /正文

从我的fasta文件中打印物种名称有困难

输入文件如下:

>NP_842573.1 chromosomal replication initiator DnaA [Bacillus anthracis str. Ames]
MENISDLWNSALKELEKKVSKPSYETWLKSTTAHNLKKDVLTITAPNEFARDWLESHYSELISETLYDLTGAKLAIRFIIPQSQAEEEIDLPPAKPNAAQDDSNHLPQSMLNPKYTFDTFVIGSGNRFAHAASLAVAEAPAKAYNPLFIYGGVGLGKTHLMHAIGHYVIEHNPNAKVVYLSSEKFTNEFINSIRDNKAVDFRNKYRNVDVLLIDDIQFLAGKEQTQEEFFHTFNALHEESKQIVISSDRPPKEIPTLEDRLRSRFEWGLITDITPPDLETRIAILRKKAKAEGLDIPNEVMLYIANQIDSNIRELEGALIRVVAYSSLINKDINADLAAEALKDIIPNSKPKIISIYDIQKAVGDVYQVKLEDFKAKKRTKSVAFPRQIAMYLSRELTDSSLPKIGEEFGGRDHTTVIHAHEKISKLLKTDTQLQKQVEEINDILK

输出文件的一部分如下所示(GCF…faa是文件名)

Y,2.798738459583378,GCF_000014005.1_ASM1400v1_protein.faa

我真的很想打印物种名称[炭疽杆菌str.Ames]和文件名。你知道吗

我需要编辑的行是:

file.write ('\nY,' + str(pY) +  ',' + str(FILE))

打印几个变量,然后打印文件名的字符串。你知道吗

但我正在努力找到一种方法,使用biopython输出fasta文件头中方括号之间的字符串。你知道吗


Tags: 文件字符串名称物种文件名npgcfames