给出一个格言:
data = {'18': [3.89, 1.28], '20': [1.39, 3.15], '15': [1.42, 3.10]}
我想挑选一些与其他明显不同的项目,如18
。理想情况下,我会指定ALLOWED_DISCREPANCY
,为demo将其设置为0.5
,这是一个阈值,它将哪些内容突出哪些内容不突出(与其他值相比)。你知道吗
带有3.89
的18
在这里显然是不正确的,因为大多数的值在1.4左右(比较每个列表中的任何一个值就足以得出结论),并且差值(abs(3.89 - 1.4)
)大于0.5
(允许的最大值)。你知道吗
Tags:
如果你想用更统计的方法来发现异常值,你可以这样做:
对于一个标准偏差:
对于2:
对于0.5:
计算这些值的平均值。你知道吗
设置阈值并构建一个新字典,将原始键映射到与约束匹配的值列表。这里有两个例子:
编辑:只考虑一个职位
相关问题 更多 >
编程相关推荐