我是新的模拟和分布拟合。我有两个数据集(一个有4k行;另一个有300k行);两个数据集如下所示:
Index | a | b | c | d
1
2
3
..
n
其中a,b的值范围为21000到800万(int),c的值范围为0到300k(十进制),d的值范围为300到100k左右(十进制)。你知道吗
a总是大于或等于b(a>;=b),c是独立的,b&d相互关联(但不是线性关系)。总之,a&b有关系;b&d有关系。你知道吗
在我的模拟中,我需要生成N行,其中Ni有a,b,c,d值。我想从我的数据集中挑选一个样本。但这不允许我有a,b,c和d的不同组合
另一种方法是拟合模型并进行一些优度检验。这是我不确定的,因为我的数据需要符合三个模型。你知道吗
1: for a and b --> both over 21,000 and a >= b
2: for c
3: for b and d
我不能单独拟合每一列,然后从每一列中单独取样。 实现这一点的最佳学术方法是什么,以及如何在python中实现这一点?你知道吗
我希望我的问题是明确的,我很抱歉,因为我的统计数字是有限的,这是我第一次处理这样的例子。我希望你能给我一些反馈或提示来帮助我。如果有帮助的话,我可以提供数字或样品。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐