如何从现有列生成具有一定相关性和r平方的随机不同变量?

2024-05-08 03:10:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图创建一个随机变量分布明显的数据框架

分布的选择为1到7,选择的概率如下:

scale = [1,2,3,4,5,6,7]
prop1 = [.05,.1,.2,.3,.2,.1,.05]

到目前为止,我需要在我的数据框架中收集400个观察结果的样本

df = pd.DataFrame({'student':np.arange(1,401,1), 
                   'Q Output1':np.random.choice(scale,400,p=prop1)}).set_index('student')

第一个变量是Q Output1,它使用了我在上面制作的量表,现在我希望第二个变量Input1是选项1到7的类似分布,但是与第一个变量具有高相关性和高R平方

在python中如何实现这一点