Python:sort函数在nan出现时中断

网友

1楼 · 编辑于 2024-05-23 16:04:48

我不确定这个bug，但解决方法可能是：

sorted(
    (2, 1, float('nan')),
    lambda x,y: x is float('nan') and -1 
                or (y is float('nan') and 1
                or cmp(x,y)))

结果是：

('nan', 1, 2)

或者在排序或其他操作之前删除nans。

网友

2楼 · 编辑于 2024-05-23 16:04:48

问题是，如果列表包含NAN，则没有正确的顺序，因为序列a1、a2、a3，…，如果a1<；=a2<；=a3<；=。。。<；=安。如果这些a值中的任何一个是NAN，则排序属性将中断，因为对于所有a，a<；=NAN和NAN<；=a都是false。

网友

3楼 · 编辑于 2024-05-23 16:04:48

前面的答案是有用的，但可能不清楚问题的根源。

在任何语言中，sort在输入值的域上应用由比较函数或以某种其他方式定义的给定顺序。例如，less than，a.k.a.operator <,可以在整个if和only中使用，前提是less than定义了输入值的适当顺序。

但对于浮点值和小于以下值的值，这尤其不正确： “NaN是无序的：它不等于、大于或小于任何东西，包括它本身。”（GNU C手册中的明文，但适用于所有基于现代IEEE754的浮点）

所以可能的解决方案是：

remove the NaNs first, making the input domain well defined via < (or the other sorting function being used)
define a custom comparison function (a.k.a. predicate) that does define an ordering for NaN, such as less than any number, or greater than any number.

任何语言都可以使用这两种方法。

实际上，考虑到python，如果您不太关心最快的性能，或者移除nan是上下文中所需的行为，我宁愿移除nan。

否则，您可以通过旧python版本中的“cmp”或通过this和functools.cmp_to_key()使用合适的谓词函数。自然，后者比先移除NaNs要尴尬得多。在定义这个谓词函数时，需要注意避免更差的性能。

相关问题更多 >

编程相关推荐

热门问题

热门文章