我有一个熊猫数据框,结构如下:
df = pd.DataFrame({'entry': [['A','B','C'],['A','B','E','D'],['C'],['D','A', 'B'],['D','C','E'],['E','A']]})
它给出:
entry
0 [A, B, C]
1 [A, B, E, D]
2 [C]
3 [D, A, B]
4 [D, C, E]
5 [E, A]
我想把它转换成方阵,在数据帧中看到的唯一符号的大小(在本例中是5:'A','B','C','D','E'),其中每个交集都是这对被一起看到的频率(比如这里这对[A,B]被一起看到3次,对[D,A]-只有一次。如果有3个或更多的符号在一起,我希望所有的组合都考虑在内。)所以输出是这样的:
A B C D E
A 3 1 1 1
B 1 1
C 1 1
D 2
E
我在这个领域是个初学者,试着写一个循环,通过所有的组合。有一个问题,事实上,有可能是任何数量的项目内的条目。你知道吗
如果您想要无序的配对,下面的应该可以使用。你知道吗
相关问题 更多 >
编程相关推荐