我有一个熊猫数据帧,它有记录相似性的结果。例如,rowid123类似于rowid512,rowid123类似于681。从技术上讲,这三排都是相似的。如何对相似的行进行分组?你知道吗
请注意,我的数据有组合-例如(123512)和(512123)
import pandas as pd
df = pd.DataFrame({'A': [123,123,512,412,412,536], 'B': [512,681,123,536,919,412]})
df
A B
123 512
123 681
512 123
412 536
412 919
536 412
预期产量
Group1 123
Group1 512
Group1 681
Group2 412
Group2 536
Group2 919
您可以使用
networkx
来确定连接的组。你知道吗相关问题 更多 >
编程相关推荐