擅长:python、mysql、java
<p>您基本上是在进行合并排序,并删除重复的条目。</p>
<p>一般来说,将输入分解为内存大小的片段,对每个片段进行排序,然后在删除重复项的同时合并片段是一个合理的想法。</p>
<p>事实上,我会让虚拟内存系统处理它,然后写下:</p>
<pre><code>input = open(infilename, 'rb')
output = open(outfile, 'wb')
for key, group in itertools.groupby(sorted(input)):
output.write(key)
</code></pre>