如何从现有列生成具有一定相关性和r平方的随机不同变量？

2024-05-19 18:18:58 发布

男 | 程序猿一只，喜欢编程写python代码。

我试图创建一个随机变量分布明显的数据框架

分布的选择为1到7，选择的概率如下：

scale = [1,2,3,4,5,6,7]
prop1 = [.05,.1,.2,.3,.2,.1,.05]

到目前为止，我需要在我的数据框架中收集400个观察结果的样本

df = pd.DataFrame({'student':np.arange(1,401,1), 
                   'Q Output1':np.random.choice(scale,400,p=prop1)}).set_index('student')

第一个变量是Q Output1，它使用了我在上面制作的量表，现在我希望第二个变量Input1是选项1到7的类似分布，但是与第一个变量具有高相关性和高R平方

在python中如何实现这一点

0条回答

目前没有回答