将数据反向聚合到可能的观测数据集中

2024-04-25 19:02:49 发布

您现在位置:Python中文网/ 问答频道 /正文

有没有可能生成一个二进制的观测数据集,其中结果数据集的比例对应于已知的聚合信息?你知道吗

例如,我有3个二进制特征a,b,c,我知道总共应该有4个观测值,其中a存在,5个观测值,其中b存在,2个观测值,其中c存在。你知道吗

a=4
b=5
c=2

我也知道在a&b存在的地方应该有3个观察,在a&c存在的地方应该有2个,在b&c存在的地方应该有2个。你知道吗

a&b=3
a&c=2
b&c=2

最后,我知道总共应该有6个观察结果。你知道吗

n=6

仅给出这些信息,对于具有100个特征的高维情况,是否有可能生成与此标准匹配的数据集?你知道吗

    A B C
1   1 1 1
2   1 1 0
3   1 1 1
4   1 0 0
5   0 1 0
6   0 1 0

Tags: 数据信息标准地方二进制情况特征比例