两个列表的布尔索引与比较：相同（？）方法，不同的结果

bom2=pd.DataFrame({'Assembly': {0: '0138104116', 1: '0309005994', 2: '0309005996', 3: '0309005998', 4: '0309005998', 5: '0309005998', 6: '0309005998', 7: '0312005996', 8: '0312005997', 9: '0312005998'}, 'Finish product': {0: '0138104116', 1: '0309005994', 2: '0309005996', 3: '0309005998', 4: '0309005998', 5: '0309005998', 6: '0309005998', 7: '0312005996', 8: '0312005997', 9: '0312005998'}})

print "method(1 + 2):", len(set(nejsou.Assembly.tolist()+nee)), "Unique Assembly IDs" print "method(1):",len(set(nejsou.Assembly.tolist())), "Unique Assembly IDs" print "method(2):",len(set(nee)), "Unique Assembly IDs" method(1 + 2): 4021 Unique Assembly IDs method(1): 4015 Unique Assembly IDs method(2): 1986 Unique Assembly IDs

2条回答

网友

1楼 · 编辑于 2024-06-16 11:24:54

考虑以下玩具示例：

import numpy as np
import pandas as pd

bom2 = pd.DataFrame(
    [
        ['A', 'F'],
        ['AF', 'F'],

        ['AF2', 'F'],   
        ['A', 'AF2'], 

        ['A', 'AF'],
        ['A2', 'AF'],

    ], columns=['ASS', 'FIN'])

print(bom2)
#    ASS  FIN
# 0    A    F
# 1   AF    F
# 2  AF2    F
# 3    A  AF2
# 4    A   AF
# 5   A2   AF

“模式”是：

AF和AF2指的是在ASS和FIN中的id。你知道吗
A和A2只在ASS中
F只在FIN中。你知道吗

然后：

ass = bom2['ASS'].tolist()
fin = bom2['FIN'].tolist()

# filter out rows of bom2 where FIN equals AF
nejsou = bom2[-bom2['FIN'].isin(ass)] 

nee = list()  #will contain ASS not in FIN
for a in ass:
    if a not in fin: nee.append(a)

print(nejsou)
#    ASS FIN
# 0    A   F
# 1   AF   F
# 2  AF2   F

收益率

print "method(1 + 2):", len(set(nejsou.ASS.tolist()+nee)), "Unique ASS IDs"
# method(1 + 2): 4 Unique ASS IDs

print "method(1):",len(set(nejsou.ASS.tolist())), "Unique ASS IDs"
# method(1): 3 Unique ASS IDs

print "method(2):",len(set(nee)), "Unique ASS IDs"
# method(2): 2 Unique ASS IDs

注意

print(set(nee))
# set(['A', 'A2'])

print(set(nejsou.ASS.tolist()))
# set(['A', 'AF2', 'AF'])

所以方法（1）和方法（2）产生不同的结果。如果您遵循此模式，您可以在其中添加任意数量的项设置。你知道吗

要增加方法（1）而不增加方法（2），请添加更多行，如AF
```
['AFn', 'F'],
['A', 'AFn'],
```
要增加方法（2）而不增加方法（1），请添加更多行，如A2
```
['An', 'AF'], 
```

仅获取Finish product在装配柱使用方法1：

In [107]: bom2.loc[~bom2['FIN'].isin(bom2['ASS'])]
Out[107]: 
   ASS FIN
0    A   F
1   AF   F
2  AF2   F

不是方法2：

In [109]: bom2[bom2['ASS'].isin(nee)]
Out[109]: 
  ASS FIN
0   A   F
4   A  AF  <  WRONG; AF is in bom2['ASS']
5  A2  AF  <  WRONG

网友

2楼 · 编辑于 2024-06-16 11:24:54

这与方法1和方法2无关，因此与编程技术无关，而与逻辑有关。此外，我有一个想法，你会得到同样的结果，如果你使用布尔索引/过滤在第二种方法，反之亦然。这是因为，如果我们将too列表与每个列表中的一些唯一值合并，那么在set（）函数之后，每个列表中将有相同的值，这些值将变成一个值而不是两个值。你知道吗

考虑以下示例：

a = [1,2,3]
b = [3,4,5]

print set(a)
print set(b)
print
print len(set(a))
print len(set(b))
print
print set(a+b)
print
print len(set(a+b))

输出：

set([1, 2, 3])
set([3, 4, 5])

3
3

set([1, 2, 3, 4, 5])

5

很高兴能帮上忙！如果你觉得我的回答对你有用，请随时接受。：-）

相关问题更多 >

编程相关推荐

热门问题

热门文章