Bins从收入数据中得出了更好的估计。
binsmooth的Python项目详细描述
宾斯穆思
“Better Estimates from Binned Income Data”的Python实现
Better Estimates from Binned Income Data: Interpolated CDFs and Mean-Matching
Paul T. von Hippel, David J. Hunter, McKalie Drown
Sociological Science
Volume 4, Number 26, Pages 641-655
2017
最初在R包^{
使用
^{pr2}$安装
通过pip安装
pip install binsmooth
改进
更好的尾部估计通过有界优化而不是临时搜索 方法在R实现中找到。在
{str}通过更精确的CDF}反向采样。这就完成了 通过与CDF的陡度成比例的取样,即取样更多 在CDF陡峭的地区。在
警告
Results与Rbinsmooth
不完全匹配,因为:
- 我们采用不同的方法来估计尾部(上限)
- 样条插值的选择
这个实现使用scipy的PchipInterpolator
,它实现了[1],
而R实现中的默认插值器是[2]。插值器
在R中,可以通过设置monoMethod="monoH.FC"
将实现更改为[1]。在
精度取决于分布的平均值。如果你这么做的话 不提供一个平均值,那么一个将被临时估计的方式和准确性 估计可能很差。在
参考文献
[1]:Fritsch,F.N.和Carlson,R.E.(1980年)。Monotone piecewise cubic interpolation。暹罗数值分析杂志
[2] :海曼,J.M.(1983年)。Accurate monotonicity preserving cubic interpolation。暹罗科学与统计计算杂志
- 项目
标签: