numpy：如何表达多人关系？

2条回答

网友

1楼 · 编辑于 2024-06-06 14:26:05

In [113]: animal_kind = ['cat', 'cat', 'cat', 'dog', 'frog', 'frog']
     ...: animal_name = ['hobbes', 'tigger', 'garfield', 'lassie', 'kermit', 'hy
     ...: pnotoad']
     ...: 
     ...: habitat_type = ['tree', 'tree', 'river', 'river', 'river', 'house', 'h
     ...: ouse', 'house']
     ...: habitat_animal = ['cat', 'frog', 'dog', 'frog', 'turtle', 'cat', 'fish
     ...: ', 'dog']
     ...:

将它们转换为阵列：

In [115]: kind,name,type,animal=[np.array(x) for x in (animal_kind,animal_name,h
     ...: abitat_type, habitat_animal)]

做一张与这一类相匹配的桌子。这个可能很大

In [116]: kind[:,None]==animal
Out[116]: 
array([[ True, False, False, False, False,  True, False, False],
       [ True, False, False, False, False,  True, False, False],
       [ True, False, False, False, False,  True, False, False],
       [False, False,  True, False, False, False, False,  True],
       [False,  True, False,  True, False, False, False, False],
       [False,  True, False,  True, False, False, False, False]])

查找匹配项（True）：

In [117]: np.nonzero(_)
Out[117]: 
(array([0, 0, 1, 1, 2, 2, 3, 3, 4, 4, 5, 5]),
 array([0, 5, 0, 5, 0, 5, 2, 7, 1, 3, 1, 3]))

使用这些索引从其他数组中选择项目：

In [118]: np.stack([name[_[0]],type[_[1]]])
Out[118]: 
array([['hobbes', 'hobbes', 'tigger', 'tigger', 'garfield', 'garfield',
        'lassie', 'lassie', 'kermit', 'kermit', 'hypnotoad', 'hypnotoad'],
       ['tree', 'house', 'tree', 'house', 'tree', 'house', 'river',
        'house', 'tree', 'river', 'tree', 'river']], dtype='<U9')

该配对可以转换为：

In [119]: _.T
Out[119]: 
array([['hobbes', 'tree'],
       ['hobbes', 'house'],
       ['tigger', 'tree'],
       ['tigger', 'house'],
       ['garfield', 'tree'],
       ['garfield', 'house'],
       ['lassie', 'river'],
       ['lassie', 'house'],
       ['kermit', 'tree'],
       ['kermit', 'river'],
       ['hypnotoad', 'tree'],
       ['hypnotoad', 'river']], dtype='<U9')

这里是按名称分组的。要按栖息地分组，请使用[116]的转置

In [123]: I,J = np.nonzero(_116.T)
In [124]: np.stack([name[J],type[I]], axis=1)
Out[124]: 
array([['hobbes', 'tree'],
       ['tigger', 'tree'],
       ['garfield', 'tree'],
       ['kermit', 'tree'],
       ['hypnotoad', 'tree'],
       ['lassie', 'river'],
       ['kermit', 'river'],
       ['hypnotoad', 'river'],
       ['hobbes', 'house'],
       ['tigger', 'house'],
       ['garfield', 'house'],
       ['lassie', 'house']], dtype='<U9')

迭代的

迭代列表解决方案是：

In [188]: alist = []
     ...: for t,a in zip(habitat_type, habitat_animal):
     ...:     for k,n in zip(animal_kind,animal_name):
     ...:         if k==a:
     ...:             alist.append([n,t,k])
     ...: 
     ...: 
In [189]: alist
Out[189]: 
[['hobbes', 'tree', 'cat'],
 ['tigger', 'tree', 'cat'],
 ['garfield', 'tree', 'cat'],
 ['kermit', 'tree', 'frog'],
 ['hypnotoad', 'tree', 'frog'],
 ['lassie', 'river', 'dog'],
 ['kermit', 'river', 'frog'],
 ['hypnotoad', 'river', 'frog'],
 ['hobbes', 'house', 'cat'],
 ['tigger', 'house', 'cat'],
 ['garfield', 'house', 'cat'],
 ['lassie', 'house', 'dog']]

由于animal_kind是排序的，我们应该能够通过只迭代“下一个”类别组来缩短内部循环。这是一个簿记细节，我将留给你（除非我感到无聊）

网友

2楼 · 编辑于 2024-06-06 14:26:05

如果您想要SQL这样的选择功能，我建议您考虑使用Pandas来处理数据。它可以愉快地存储Numpy数组，但您有非常灵活的筛选选项，可以通过多种不同的方式对数据进行切片

对于您所要求的，我不知道您是否需要做更多的事情，而不仅仅是创建数据帧并对其进行迭代。下面是一个试图与您的SQL示例保持一致的示例：

import pandas as pd

animal_kind = ['cat', 'cat', 'cat', 'dog', 'frog', 'frog']
animal_name = ['hobbes', 'tigger', 'garfield', 'lassie', 'kermit', 'hypnotoad']

habitat_type = ['tree', 'tree', 'river', 'river', 'river', 'house', 'house', 'house']
habitat_animal = ['cat', 'frog', 'dog', 'frog', 'turtle', 'cat', 'fish', 'dog']

df_animal = pd.DataFrame(data=animal_kind, columns=["animal"], index=animal_name)
habitat_to_animal = pd.DataFrame()
habitat_to_animal["animal"] = habitat_animal
habitat_to_animal["habitat"] = habitat_type

for i in range(len(habitat_to_animal)):
    animal, habitat = habitat_to_animal.loc[i]
    names = df_animal[df_animal.animal == animal].index
    for name in names:
        print(f"({name},{habitat})")

这将按要求生成您的列表。我认为它可以很好地扩展，但是有3-4种不同的方法来迭代Pandas中的行，最快的方法取决于数据和您对它所做的操作

迭代的

相关问题更多 >

编程相关推荐

热门问题

热门文章

numpy：如何表达多人关系？

迭代的

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >