Я хочу выполнить анализ смоделированной мощности для набора данных, который у меня есть.Давайте предположим, что набор данных имеет четыре переменные (имена столбцов набора данных):
Y - это зависимая переменная, непрерывная и нормально распределенная.
X1 - независимая переменная, непрерывная иимеет нормальное распределение.
X2 - независимая переменная, является непрерывной и НЕ распределяется нормально.
X3 - независимая переменная, является непрерывной и НЕ распределяется нормально.
Теперь эти данные состоят из 5000 строк, поэтому существует 5000 записей.
Я выполнил линейную регрессию, используя следующую формулу:
summary(lm( Y ~ X1 + X2 + X3))
, и определил коэффициенты регрессии X1, X2 и X3, чтобы они были B1, B2 и B3 соответственно.
Теперь у меня есть пятая переменная (x4), к которой у меня нет доступа, но я считаю, что она нормально распределена.Теперь линейная модель может быть обновлена по следующей формуле:
lm(Y ~ X1 + X2 + X3 + X4)
, с коэффициентом регрессии B4.
Я не знаю, что такое B4, но у меня есть несколько сценариев, где B4 находится между 0,2 - 0,5.
Я хочу запустить симуляции Монте-Карло, чтобы проверить, какой размер выборки необходим для достижения 80% мощности на различных B4.Для этого мне нужно сгенерировать нормально распределенную переменную, которая может имитировать х4 и имеет коэффициент регрессии B4.Есть ли способ сгенерировать это в R?