用Zscore方法去除数据集中的异常值
Outlier-Removal-Naman-Goyal的Python项目详细描述
异常值去除
一个python包,用于使用Z-score方法在数据集中实现离群值移除。在
Z分数是标准差的有符号数,通过这些标准差,观察值或数据点的值高于所观察或测量值的平均值。 Z-score背后的直觉是通过找到它们与数据点组的标准差和平均值的关系来描述任何数据点。Z-score是求平均值为0,标准差为1的数据分布,即正态分布。 在计算Z分数时,我们重新调整数据的比例和中心,并寻找离零太远的数据点。这些离零太远的数据点将被视为异常值。在大多数情况下,使用阈值3或-3,即,如果Z分数值分别大于或小于3或-3,则该数据点将被标识为异常值。在
- 项目
标签: