我有一组值,这些值在一个区间[a, b]内随机分布。现在我想设定一个阈值a < c < b,使得这组值中有80%的值都在[a, c]这个范围内。这里假设a是这组值的最小值,而b是最大值。
你问的其实是你数据集中第80个百分位数。
在这个链接中,有一些代码建议(包括NumPy/SciPy和纯Python的方式):如何用Python/Numpy计算百分位数?