使用biopython从输出文件中的文件标题打印物种名称(对于多个文件)

2024-06-13 08:25:15 发布

您现在位置:Python中文网/ 问答频道 /正文

从我的fasta文件中打印物种名称有困难

输入文件如下:

>NP_842573.1 chromosomal replication initiator DnaA [Bacillus anthracis str. Ames]
MENISDLWNSALKELEKKVSKPSYETWLKSTTAHNLKKDVLTITAPNEFARDWLESHYSELISETLYDLTGAKLAIRFIIPQSQAEEEIDLPPAKPNAAQDDSNHLPQSMLNPKYTFDTFVIGSGNRFAHAASLAVAEAPAKAYNPLFIYGGVGLGKTHLMHAIGHYVIEHNPNAKVVYLSSEKFTNEFINSIRDNKAVDFRNKYRNVDVLLIDDIQFLAGKEQTQEEFFHTFNALHEESKQIVISSDRPPKEIPTLEDRLRSRFEWGLITDITPPDLETRIAILRKKAKAEGLDIPNEVMLYIANQIDSNIRELEGALIRVVAYSSLINKDINADLAAEALKDIIPNSKPKIISIYDIQKAVGDVYQVKLEDFKAKKRTKSVAFPRQIAMYLSRELTDSSLPKIGEEFGGRDHTTVIHAHEKISKLLKTDTQLQKQVEEINDILK

输出文件的一部分如下所示(GCF…faa是文件名)

Y,2.798738459583378,GCF_000014005.1_ASM1400v1_protein.faa

我真的很想打印物种名称[炭疽杆菌str.Ames]和文件名。你知道吗

我需要编辑的行是:

file.write ('\nY,' + str(pY) +  ',' + str(FILE))

打印几个变量,然后打印文件名的字符串。你知道吗

但我正在努力找到一种方法,使用biopython输出fasta文件头中方括号之间的字符串。你知道吗


Tags: 文件字符串名称物种文件名npgcfames
1条回答
网友
1楼 · 发布于 2024-06-13 08:25:15

正如克里斯•伦兹在评论中指出的,答案是:

 record.description.split('[', 1)[1].split(']', 1)[0]

相关问题 更多 >