我有一个这种格式的数据帧
| id | account | address |
|----|---------|---------|
| 1 | acc1 | add1 |
| 2 | acc1 | add2 |
| 3 | acc2 | add2 |
| 4 | acc3 | add3 |
| 5 | acc1 | add4 |
| 6 | acc4 | add5 |
| 7 | acc2 | add6 |
| 8 | acc5 | add7 |
| 9 | acc6 | add4 |
| 10 | acc7 | add8 |
| 11 | acc8 | add9 |
| 12 | acc2 | add10 |
| 13 | acc3 | add11 |
| 14 | acc9 | add12 |
现在,我想创建一个组索引,在其中查找帐户或地址已经是组的一部分的组。像下面这样
| id | account | address | group_index |
|----|---------|---------|-------------|
| 1 | acc1 | add1 | group1 |
| 2 | acc1 | add2 | group1 |
| 3 | acc2 | add2 | group1 |
| 4 | acc3 | add3 | group2 |
| 5 | acc1 | add4 | group1 |
| 6 | acc4 | add5 | group3 |
| 7 | acc2 | add6 | group1 |
| 8 | acc5 | add7 | group4 |
| 9 | acc6 | add4 | group1 |
| 10 | acc7 | add8 | group5 |
| 11 | acc8 | add9 | group6 |
| 12 | acc2 | add10 | group7 |
| 13 | acc3 | add11 | group2 |
| 14 | acc9 | add12 | group8 |
所以,首先我从id(1)=(acc1,add1)开始,分配一个组索引,比如说group1。 然后,id(2)是(acc1,add2);因为acc1已经是group1的一部分,所以我将这个id(2)也分配给group1。 然后,id(3)是(acc2,add2);因为add2已经是group1的一部分(来自上一个赋值),所以我也将id(3)赋值给group1。你知道吗
类似地,我想创建一个组,如果帐户或地址已经在一个组中,那么帐户或地址出现的所有ID都应该是同一个组的一部分。你知道吗
我相信你需要:
相关问题 更多 >
编程相关推荐