擅长:python、mysql、java
<p>假设您的文件仅由每行一个序列排列的序列组成,我建议如下:</p>
<pre><code>seq_file = open(#your file)
sequences = [seq for seq in seq_file]
uniques = list(set(sequences))
</code></pre>
<p>假设你有记忆。多少百万?在</p>
<p>预计到达时间:</p>
<p>正在读取上面的注释(但是没有注释特权)-假设序列ID对于任何重复项都是相同的,这将起作用。如果重复的序列可以不同的序列id,那么就要知道文件中哪个是第一个,它们之间是什么。在</p>