我有一个文本文件如下所示:
# sampleID HGDP00511 HGDP00511 HGDP00512 HGDP00512 HGDP00513 HGDP00513
M rs4124251 0 0 A G 0 A
M rs6650104 0 A C T 0 0
M rs12184279 0 0 G A T 0
我想比较连续的列并返回匹配元素的数量。我想用Python来做这个。早些时候,我使用Bash和AWK(shell脚本)来完成,但是速度非常慢,因为我需要处理大量的数据。我相信Python将是一个更快的解决方案。但是,我对Python非常陌生,我已经有了这样的东西:
^{pr2}$这显然行不通。由于我对Python非常陌生,我不知道要做什么更改才能使其正常工作。(这段代码是完全错误的,我想我可以使用difflib等等,但是,我以前从来没有熟练地用Python编写过代码,所以,对继续下去持怀疑态度)
我想比较并返回文件中每一列(从第三列开始)中不匹配元素的数目。我总共有828列。因此我需要828*828个输出。(你可以考虑一个n*n矩阵,其中第(i,j)个元素是它们之间不匹配元素的数量。对于上述代码段,我希望的输出是:
^{3}$如有任何帮助,我们将不胜感激。谢谢。在
我强烈建议您使用pandas而不是编写自己的代码:
解决这个问题的纯原生python库方法-让我们知道它与bash828x828的比较应该是在公园里散步。在
元素列计数:
为了简单和说明性的目的,我特意在序列翻转中添加了一个步骤——您可以通过更改类对象的逻辑或用法、函数修饰符等来改进它。。。在
Python 2.7代码:
样本输出
^{pr2}$相关问题 更多 >
编程相关推荐