Python获取Pandas的Apply函数的值的索引

2024-05-13 19:19:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我必须重新编码一些我必须编码的单倍型。我把它们放在一个由305行和129902列组成的Pandas数据帧上,看起来像这样(只有一列20行):

rs#                                                  rs12914615  
SNPalleles                                                  C/T  
chrom                                                     chr15  
pos                                                    98259206  
strand                                                        +  
genome_build                                           ncbi_B36  
center                                               affymetrix  
protLSID      urn:LSID:affymetrix.hapmap.org:Protocol:Genome...  
assayLSID     urn:LSID:affymetrix.hapmap.org:Assay:SNP_A-837...  
panelLSID         urn:lsid:dcc.hapmap.org:Panel:CEPH-30-trios:1  
QC_code                                                     QC+  
NA06985                                                      CT  
NA06991                                                      CT  
NA06993                                                      CT  
NA06993.dup                                                  CC  
NA06994                                                      CC  
NA07000                                                      CC  
NA07019                                                      CT  
NA07022                                                      CT  

这样做的目的是比较每个个体的值(NA06…)是否与野生型(SNPalleles行的第一个字母)具有相同的核苷酸,或者如果没有,则相应地进行编码。在

我的问题是我不知道如何在引用同一列中另一行上的wildtype时遍历数据帧。在

输出应该如下所示:

^{pr2}$

0为野生型(CC为该基因),1为杂合子(CT),2为突变纯合子(TT)。在

谢谢你的帮助。在


Tags: 数据orgpandas编码ccrsctqc