谢谢你的阅读
我有一个数据框,看起来像这样:
Col_A Col_B Col_C Col_D Col_E
1 2 null null null
1 null 3 null null
null 2 3 null null
null 2 null 4 null
1 null null null 5
每一行由两个ID之间的匹配组成(例如,第一行中a列的ID1匹配到B列的ID2)
在上面的示例中,所有5个ID都已连接(1连接到2、2到3、2到4、1到5)。因此,我想创建一个新列,将所有这些行聚集在一起,以便轻松访问每组匹配对:
Col_A Col_B Col_C Col_D Col_E Group ID
1 2 null null null 1
1 null 3 null null 1
null 2 3 null null 1
null 2 null 4 null 1
1 null null null 5 1
我还没有找到一个类似的问题,但如果这是重复的,我道歉。非常感谢您的建议
正如@YOBEN_S和@QuangHoang所建议的,您可以像这样使用networkx库和Graph Theory connnected components
鉴于df
使用
输出:
相关问题 更多 >
编程相关推荐