我有两个数据集。其中一个包含16169行乘5列,我想用相应的名称替换其中一列。这些对应的名字来自另一个数据集。你知道吗
例如:
UniProtID NAME Q15173 PPP2R5B P30154 PPP2R1B P63151 PPP2R2A DrugBankID Name Type UniProtID UniProt Name DB00001 Lepirudin BiotechDrug P00734 Prothrombin DB00002 Cetuximab BiotechDrug P00533 Epidermal growth factor receptor DB00002 Cetuximab BiotechDrug O75015 Low affinity immunoglobulin gamma Fc region receptor III-B
在本例中,我想用上面数据集示例中相应的名称替换所有UniProt ID。最好的办法是什么?你知道吗
我真的是新的编程和python所以任何建议,帮助是感激的。你知道吗
我认为您需要由^{} 创建的^{} ,如果某些值与get
NaN
不匹配:如果
NaN
需要原始值:与^{} -需要} 或^{} 连接的解决方案,最后通过^{} 删除列:
left
与^{解决这个问题的更一般的方法是对两个表执行类似SQL的连接。你知道吗
注意:对于较大的数据集,这可能会很昂贵,我还没有尝试过性能。你知道吗
引用:https://pandas.pydata.org/pandas-docs/stable/merging.html#overlapping-value-columns
相关问题 更多 >
编程相关推荐