Я пытаюсь создать фрейм данных с различным распределением случайных величин
выбор распределения - от 1 до 7, и вероятность выбора следующая:
scale = [1,2,3,4,5,6,7]
prop1 = [.05,.1,.2,.3,.2,.1,.05]
Мне нужна выборка из 400 наблюдений в моем фрейме данных до сих пор
df = pd.DataFrame({'student':np.arange(1,401,1),
'Q Output1':np.random.choice(scale,400,p=prop1)}).set_index('student')
Первая переменная Q Output1
, которая использует шкалу, которую я сделал выше, теперь я буду sh вторая переменная Input1
для быть аналогичным распределением вариантов с 1 по 7, однако с высокой корреляцией и высоким R в квадрате к первой переменной?
Как бы я сделал это в python?