根据列表和数据框架制作词典

dict = {(1, 2): 0, (1, 3): 0, (1, 4): 0, (1, 5): 0, (2, 1): 0, (2, 3): 0, (2, 4): 0, (2, 5): 0, (3, 1): 0, (3, 2): 0, (3, 4): 0, (3, 5): 0, (4, 1): 0, (4, 2): 0, (4, 3): 0, (4, 5): 0, (5, 1): 0, (5, 2): 0, (5, 3): 0, (5, 4): 0}

2条回答

网友

1楼 · 编辑于 2024-04-23 18:32:18

我认为不需要启动dict，只要使用double for循环：

import pandas as pd
from io import StringIO
csv=StringIO("""
   1   2   3   4   5
0   1   1   1   0   0 
1   1   1   0   0   0 
2   1   0   0   1   1 
3   1   1   0   1   0 
4   0   1   1   0   0""")
sample = pd.read_csv(csv,sep='\s+')

col_com={}
for i in range(sample.shape[1]-1):
    for j in range(i+1,sample.shape[1]):
        col_com[(i+1,j+1)]=sum(sample.iloc[:,i]&sample.iloc[:,j])
col_com

结果是：

{(1, 2): 3,
 (1, 3): 1,
 (1, 4): 2,
 (1, 5): 1,
 (2, 3): 2,
 (2, 4): 1,
 (2, 5): 0,
 (3, 4): 0,
 (3, 5): 0,
 (4, 5): 1}

希望有帮助

网友

2楼 · 编辑于 2024-04-23 18:32:18

这似乎起到了作用：

d_1 = {(1, 2): 0,
       (1, 3): 0,
       (1, 4): 0,
       (1, 5): 0,
       (2, 1): 0,
       (2, 3): 0,
       (2, 4): 0,
       (2, 5): 0,
       (3, 1): 0,
       (3, 2): 0,
       (3, 4): 0,
       (3, 5): 0,
       (4, 1): 0,
       (4, 2): 0,
       (4, 3): 0,
       (4, 5): 0,
       (5, 1): 0,
       (5, 2): 0,
       (5, 3): 0,
       (5, 4): 0}

new_keys = []
for k in d_1:
    invert = (k[1], k[0])
    if invert not in new_keys:
        new_keys.append(k)

d_2 = {}
for k in new_keys:
    d_2[k] = d_1[k]

df = [
  [1,  1,  1,  0,  0],
  [1,  1,  0,  0,  0],
  [1,  0,  0,  1,  1],
  [1,  1,  0,  1,  0],
  [0,  1,  1,  0,  0],
]

d_3 = {}
for k in d_2:
    v = 0
    c1, c2 = k[0] - 1, k[1] - 1
    for line in df:
        if line[c1] == line[c2]:
            v += 1
    d_3[k] = v

print(d_3)

输出：

{(1, 2): 3, (1, 3): 1, (1, 4): 3, (1, 5): 2, (2, 3): 3, (2, 4): 1, (2, 5): 0, (3, 4): 1, (3, 5): 2, (4, 5): 4}

（看起来您的示例至少有一个错误：结果（1,4）应该是3，而不是2，因为第2、3和4行与第1和4列匹配。）

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据列表和数据框架制作词典

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >