用我的经验数据拟合分布模型？还是仅仅使用数据？

2024-04-18 22:42:46 发布

男 | 程序猿一只，喜欢编程写python代码。

我是新的模拟和分布拟合。我有两个数据集（一个有4k行；另一个有300k行）；两个数据集如下所示：

Index | a | b | c | d
1
2
3
..
n

其中a，b的值范围为21000到800万（int），c的值范围为0到300k（十进制），d的值范围为300到100k左右（十进制）。你知道吗

a总是大于或等于b（a>；=b），c是独立的，b&d相互关联（但不是线性关系）。总之，a&b有关系；b&d有关系。你知道吗

在我的模拟中，我需要生成N行，其中Ni有a，b，c，d值。我想从我的数据集中挑选一个样本。但这不允许我有a，b，c和d的不同组合

另一种方法是拟合模型并进行一些优度检验。这是我不确定的，因为我的数据需要符合三个模型。你知道吗

1: for a and b --> both over 21,000 and a >= b
2: for c
3: for b and d

我不能单独拟合每一列，然后从每一列中单独取样。实现这一点的最佳学术方法是什么，以及如何在python中实现这一点？你知道吗

我希望我的问题是明确的，我很抱歉，因为我的统计数字是有限的，这是我第一次处理这样的例子。我希望你能给我一些反馈或提示来帮助我。如果有帮助的话，我可以提供数字或样品。你知道吗

Tags： and 数据方法模型 gt for index 关系

0条回答

目前没有回答