我有一个Genbank
文件,其中包含许多序列。我有第二个文本文件,其中包含这些序列的名称,以及一些其他有关它们的信息,在一个TSV中,我把它作为一个数据帧读入。我使用.sample函数从这个数据中随机选择一个名称,并将其赋给变量n_name
,如下面的代码块所示。你知道吗
n = df_bp_pos_2.sample(n = 1)
n_value = n.iloc[:2]
n_name = n.iloc[:1]
n_name
等于genbank
文件中的基因座名称,大小写精确。我试图通过genbank
文件进行解析,并提取具有locus = n_name
的序列。genbank
文件名为all.gb
。我有:
from Bio import SeqIO
for seq_record in SeqIO.parse("all.gb", "genbank"):
但是我不太确定下一行或者下一行应该是什么,用轨迹来解析?有什么想法吗?你知道吗
您也可以使用轨迹标记列表,而不是仅使用一个轨迹标记。你知道吗
您可以在Biopython Cookbook中找到更多关于
extract
方法和特性限定符的信息。你知道吗相关问题 更多 >
编程相关推荐