我的数据框如下所示:
col1 col2 col3
Aba xxx yyy
bab bhh jjj
ccc kkk lll
Aba xxx yyy
ccc kkk jjj
我想用以下内容替换每个列的唯一值:
在col1
中:Aba
被替换为a0
,bab
被替换为a1
,ccc
将被a2
替换,无论它出现在列中的哪个位置。在
与col2
相似:xxx
被b0
替换,bhh
被b1
等替换
简而言之,第一列开始用a0,a1,a2,a3
替换唯一值,第二列用b0,b1,b2,b3
替换,第三列用c0,c1,c2
替换。。等。在
在循环中寻找一个解决方案,这样我就可以处理所有列和所有唯一值,因为我有超过一百万行。在
谢谢
我会这样做:
更通用的方法:
^{pr2}$这是一个
numpy
解决方案。它应该是有效的,因为列表理解通常比apply
+lambda
快。在字母表范围的源:Alphabet range python
相关问题 更多 >
编程相关推荐