Как моделировать внутриклассовые коррелированные данные? - PullRequest
1 голос
/ 26 сентября 2019

Я моделирую случайный набор данных для смешанной модели.Чтобы смешанная модель имела смысл, точки данных в кластере должны коррелироваться (ICC).Как мне сгенерировать такие данные?

Это мои переменные:

  • ID
  • база (базовая линия, первое измерение)
  • половина (секунда)измерение)
  • окончательное (окончательное измерение)
  • контроль (контрольная или экспериментальная группа?)
  • кластер (факторная переменная, показывающая, к какому кластеру принадлежит человек)

И мне нужны три измерения, вложенные в каждый кластер для корреляции.

 N <- 200  
 ID <- seq(from = 1, to = N, by = 1)
 control <- rbinom(n=N, size = 1, prob = .5) 
 cluster <- as.factor(rbinom(n=N, size = 2, prob = .5) + 1)
 base <- rnorm(n=N,mean = 100,sd=15)
 half <- base + rnorm(n=N, mean = 0, sd = 3) + control*tau_1
 final <-  half + control*(tau_2-tau_1) + rnorm(n=N, mean = 0, sd = 3)
 df.wide <- data.frame(ID,control,age,cluster,base,half,final)

Код основан на том, что я пишу выше + я добавляю немного шума, таким образом,

rnorm(n=N, mean = 0, sd = 3)

во 2-м и 3-м измерениях.

Как сделать три измерения внутрикорреляционными внутри кластеров?

Спасибо.

...