检查数字列表是否在特定范围内?

4 投票
3 回答
11732 浏览
提问于 2025-04-18 00:00

我想把一些数字分成不同的类别,方法是检查这些数字是否在某个范围内,然后根据这个范围给它们分配一个编号。不过,我得到的结果并不完全正确。

mapp 是一个字典,它定义了不同的范围,以及对应这些范围的值。

lst 是我想要与这些范围进行匹配的数字列表,并给它们分配标识符。

mapp = {(0,100): 1, (100,400): 2, (400,800): 3}


lst = [3.5, 5.4, 300.12, 500.78, 600.45, 900.546]


def discretize(mapping_dict, list_of_values):
    print "\n"
    location = []
    for x in sorted(list_of_values):
        for (lower_bound,upper_bound),value in mapping_dict.items():
            if round(x) in range(lower_bound,upper_bound):
                print round(x), "yes", value

                distance = mapping_dict[(lower_bound,upper_bound)]
                location.append((distance))


        else:
            print round(x), "no"

            distance = len(mapping_dict.items())+10
            location.append((distance))

    return location

我期望的结果是:[1, 1, 2, 3, 3, 13],但实际上得到的结果并不是这样。

这是我实际得到的结果,显然是错误的:

4.0 yes 1
4.0 no         #wrong!
5.0 yes 1
5.0 no         #wrong!
300.0 yes 2
300.0 no         #wrong!
501.0 yes 3
501.0 no         #wrong!
600.0 yes 3
600.0 no         #wrong!
901.0 no         #CORRECT

[1, 13, 1, 13, 2, 13, 3, 13, 3, 13, 13]

我在 4.0 这个数字上得到了 no,这显然是不对的,等等。

问题出在哪里呢?

谢谢

3 个回答

1

我觉得我之前遇到过类似的问题,因为我发现了一个小的 RangeDict 类:

class RangeDict (dict):
    def __init__ (self, *args):
        super ().__init__ ()

    def __setitem__ (self, k, v):
        if not isinstance (k, slice): raise ValueError ('Indices must be slices.')
        super ().__setitem__ ( (k.start, k.stop), v)

    def __getitem__ (self, k):
        for (start, stop), v in self.items ():
            if start <= k < stop: return v
        raise IndexError ('{} out of bounds.'.format (k) )

我希望这个类能实现你想要的功能。显然,查找的时间复杂度是 O(N),而不是 O(1)。

使用示例:

r = RangeDict ()
r [0:100] = 1
r [100:400] = 2
r [400:800] = 3

for x in [3.5, 5.4, 300.12, 500.78, 600.45, 900.546]:
    print (r [x] )
#Last value raises IndexError
1

在你的 for 循环后面加一个 else 是个不错的主意!当你在循环后面加上 else 时,这个 else 块会在循环正常结束时执行,也就是说没有使用像 break 这样的语句。因此,假设你的组是互不重叠的,你只需要在 if 块的末尾加一个 break 语句,也就是在 location.append((distance)) 之后。这样就能按预期工作了。

另外,不用每次都检查数字是否在 range 里(这样会每次都创建和搜索一个列表!),你可以直接用 <=< 来比较。而且你已经有了 value,那为什么不直接用它呢?

for (lower_bound, upper_bound), value in mapping_dict.items():
    if lower_bound <= x < upper_bound:
        location.append(value)
        break
else:
    location.append(len(mapping_dict) + 10)
3
mapp = {(0,100): 1, (100,400): 2, (400,800): 3}
lst = [3.5, 5.4, 300.12, 500.78, 600.45, 900.546]
result = []
for l in lst:
    for m in mapp:
        if m[0] < l < m[1]:
            result.append(mapp[m])

print result

输出结果:

[1, 1, 2, 3, 3]

编辑:

result = []
for l in lst:
    flag=True
    for m in mapp:
        if m[0] < l < m[1]:
            result.append(mapp[m])
            flag = False
            break
    if flag:
        result.append(-1)
print result

输出结果:

[1, 1, 2, 3, 3, -1]

撰写回答