有不同版本的“无”的合理方式？

网友

1楼 · 编辑于 2024-04-25 18:10:16

如果您只想要一个不是任何已知值且也不是None的对象，只需创建一个新对象：

NOT_APPLICABLE = object()
NOT_MEASURED = object()
UNKNOWN = object()

现在可以像使用None那样使用这些值：

^{pr2}$

等等

如果您需要一个可以表示为float的值（例如在numpy数组中），您可以用尾数编码的“额外”数据创建一个NaN值。然而，这样做可能不安全，因为不能保证通过对值的各种操作来保存这些位。在

网友

2楼 · 编辑于 2024-04-25 18:10:16

最简单的方法是使用字符串：“not counted”、“unknown”和“N/A”。但是，如果您想在numpy中快速处理，那么具有混合数字/对象的数组不是您的朋友。在

我的建议是添加几个与数据形状相同的数组，由0和1组成。因此数组missing=1，其中spot丢失，其他为0，以此类推，与数组not_measured等相同。。在

然后，您可以在任何地方使用nan，然后使用np.where(missing == 1)屏蔽数据，以便轻松地找到所需的特定nan。在

网友

3楼 · 编辑于 2024-04-25 18:10:16

建议为每个案例创建三个不同的object实例。在

由于您希望这些对象具有NaN的属性，因此可以尝试创建三个不同的NaN实例。在

NOT_APPLICABLE = float("nan")
NOT_MEASURED = float("nan")
UNKNOWN = float("nan")

这是一个黑客攻击的极限，因此使用风险自负，但我不相信任何Python实现都会优化NaN来始终重用同一个对象。不过，您可以添加一个sentinel条件，以便在运行之前进行检查。在

^{pr2}$

如果这样做的话，这样做的好处是允许您比较NaNid以检查其含义。在

row = [1.0, 2.4, UNKNOWN]

...

if value is UNKNOWN:
    ...

同时，它保留了numpy可能对其数组进行的任何优化。在

披露：这是一个老生常谈的建议，我很想听听别人的意见。