我试图创建一个随机变量分布明显的数据框架
分布的选择为1到7,选择的概率如下:
scale = [1,2,3,4,5,6,7]
prop1 = [.05,.1,.2,.3,.2,.1,.05]
到目前为止,我需要在我的数据框架中收集400个观察结果的样本
df = pd.DataFrame({'student':np.arange(1,401,1),
'Q Output1':np.random.choice(scale,400,p=prop1)}).set_index('student')
第一个变量是Q Output1
,它使用了我在上面制作的量表,现在我希望第二个变量Input1
是选项1到7的类似分布,但是与第一个变量具有高相关性和高R平方
在python中如何实现这一点
目前没有回答
相关问题 更多 >
编程相关推荐