我必须重新编码一些我必须编码的单倍型。我把它们放在一个由305行和129902列组成的Pandas数据帧上,看起来像这样(只有一列20行):
rs# rs12914615
SNPalleles C/T
chrom chr15
pos 98259206
strand +
genome_build ncbi_B36
center affymetrix
protLSID urn:LSID:affymetrix.hapmap.org:Protocol:Genome...
assayLSID urn:LSID:affymetrix.hapmap.org:Assay:SNP_A-837...
panelLSID urn:lsid:dcc.hapmap.org:Panel:CEPH-30-trios:1
QC_code QC+
NA06985 CT
NA06991 CT
NA06993 CT
NA06993.dup CC
NA06994 CC
NA07000 CC
NA07019 CT
NA07022 CT
这样做的目的是比较每个个体的值(NA06…)是否与野生型(SNPalleles行的第一个字母)具有相同的核苷酸,或者如果没有,则相应地进行编码。在
我的问题是我不知道如何在引用同一列中另一行上的wildtype时遍历数据帧。在
输出应该如下所示:
^{pr2}$0为野生型(CC为该基因),1为杂合子(CT),2为突变纯合子(TT)。在
谢谢你的帮助。在
相关问题 更多 >
编程相关推荐