np.logical_or
和functools.reduce
返回不同的结果。你知道吗
kdf = pd.DataFrame(data={'col1' : [' False', 1, np.nan], 'dt': [datetime.now(), ' 2018-12-12', '2019-12-12'], 'bool':
[False, True, True], 'i': [1,2,'3'], 'bnan': [False, True, np.nan], 'col2': [' True ', False, 'False']})
print([kdf[i].str.contains('^\s*F') for i in ['col1', 'col2']])
# [0 True
# 1 NaN
# 2 NaN
# Name: col1, dtype: object, 0 False
# 1 NaN
# 2 True
# Name: col2, dtype: object]
您可以看到它返回预期的输出,但是当我们用np.logical_or
重新使用它时,它返回第三行的Nan
,而不是True
from functools import reduce
reduce(np.logical_or, [kdf[i].str.contains('^\s*F') for i in ['col1', 'col2']])
# 0 True
# 1 NaN
# 2 NaN
# dtype: object
但是np.logical_or(np.nan, True)
返回True
。我希望reduce能把这个函数应用到所有的列表项上,比如
kdf['col1'].str.contains('^\s*F') | kdf['col2'].str.contains('^\s*F')
我错过什么了吗?你知道吗
我认为这是一个错误,为了正确处理nan,应该将它们替换为一些布尔值,例如用
na=False
参数替换为False
:相关问题 更多 >
编程相关推荐