用我的经验数据拟合分布模型?还是仅仅使用数据?

2024-04-18 22:42:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我是新的模拟和分布拟合。我有两个数据集(一个有4k行;另一个有300k行);两个数据集如下所示:

Index | a | b | c | d
1
2
3
..
n

其中a,b的值范围为21000到800万(int),c的值范围为0到300k(十进制),d的值范围为300到100k左右(十进制)。你知道吗

a总是大于或等于b(a>;=b),c是独立的,b&d相互关联(但不是线性关系)。总之,a&b有关系;b&d有关系。你知道吗

在我的模拟中,我需要生成N行,其中Ni有a,b,c,d值。我想从我的数据集中挑选一个样本。但这不允许我有a,b,c和d的不同组合

另一种方法是拟合模型并进行一些优度检验。这是我不确定的,因为我的数据需要符合三个模型。你知道吗

1: for a and b --> both over 21,000 and a >= b
2: for c
3: for b and d

我不能单独拟合每一列,然后从每一列中单独取样。 实现这一点的最佳学术方法是什么,以及如何在python中实现这一点?你知道吗

我希望我的问题是明确的,我很抱歉,因为我的统计数字是有限的,这是我第一次处理这样的例子。我希望你能给我一些反馈或提示来帮助我。如果有帮助的话,我可以提供数字或样品。你知道吗


Tags: and数据方法模型gtforindex关系