Как создать массив и оценить в R из набора строковых переменных с предсказанными вероятностями - PullRequest
0 голосов
/ 22 мая 2019

Я хочу создать 5D массив из набора 2000 наблюдений и набора строковых переменных с прогнозируемыми вероятностями (всего 7280 столбцов = 2 * 14 * 52 * 5) по полу (2), возрасту (14), округ (52) и индекс депривации (5), за которым следует сводка по районам (среднее значение и 95% ДИ) в R. Имена переменных выглядят следующим образом: столбец 1: 'pre [1,1,1,1]', до 'pre [2,14,52,5]', все в строковом формате. Вот ссылка на файл данных: https://drive.google.com/file/d/1i_caH1IQrKlHTJ3BnCS00ZHrk2HTjyXO/view

Мне удалось настроить массив (2000,2,5,52), однако код «для цикла», написанный для извлечения различных столбцов из прогнозируемых значений вероятности, представляется проблематичным.

dat<-read.csv("allsamp.csv")
A<-array(0, c(2000,2,14,5,52))
  for ( i in 1:2){
    for (j in 1:14){
     for (k in 1:5){
      for (l in 1:52){ 
  A[,i,j,k,l] <-dat['pre[,i,j,l,k]']
   }}}}

#District level predicted probability 
res<-rep(0,2000*52)
 for (i in 1:52) {
 res[i]<-A(sum[1:2000, 1:2, 1:14, 1:5, i])
 }

Я ожидаю, что выходные данные "NA" в вычислении массива будут действительными значениями. Как только массив будет правильно рассчитан, будут сгенерированы оценки уровня района для вычисления средних значений уровня района и вероятного интервала 95%.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...