我有两个数据集(基因名称列表/列),例如:
df1
Gene_id
SUMO2
CDC37
COPB2
BECN1
CAPNS1
以及
df2
Gene_id
SUMO2
BECN1
CAPNS1
我想建立一个新的数据集,其中有2列的基因名称匹配。第1列是所有df1基因,第2列是所有df2基因。NA是第2列没有匹配项的地方,如下所示。最好使用R或Python中的dplyr。谢谢
Gene_id Gene_id
SUMO2 SUMO2
CDC37 NA
COPB2 NA
BECN1 BECN1
CAPNS1 CAPNS1
Tags:
我们可以使用
%in%
相关问题 更多 >
编程相关推荐