两个不成对数据集的相似性估计

2024-05-15 03:15:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着比较数据(黑色)和模型(颜色)。[图1]

Model (color) and data (black)

还有一个例子[图2]。图1和图2的数据集和模型不同。 Model (color) and data (black)

在这两种情况下,似乎在模型和数据之间存在重叠,然而,重叠/匹配对于图2更好。我想量化两种情况下数据和模型的相关性,以便区分两个数字的“拟合优度”。我想知道我应该用哪种(统计)方法来定量估计相关性。在


Tags: 数据方法模型颜色情况数字例子区分
1条回答
网友
1楼 · 发布于 2024-05-15 03:15:01

您可以首先使用numpy.mean计算每个数据集的重心,然后比较它们之间的距离。 下一步是检查每个中心是否在另一个数据集的不确定椭圆(http://www.visiondummy.com/2014/04/draw-error-ellipse-representing-covariance-matrix/)内。在

最后,我建议使用假设测试,如学生测试或f测试。在scipy中有一些方法可用于此类测试,请查看文档

相关问题 更多 >

    热门问题