Я хочу создать 5D массив из набора 2000 наблюдений и набора строковых переменных с прогнозируемыми вероятностями (всего 7280 столбцов = 2 * 14 * 52 * 5) по полу (2), возрасту (14), округ (52) и индекс депривации (5), за которым следует сводка по районам (среднее значение и 95% ДИ) в R. Имена переменных выглядят следующим образом: столбец 1: 'pre [1,1,1,1]', до 'pre [2,14,52,5]', все в строковом формате. Вот ссылка на файл данных: https://drive.google.com/file/d/1i_caH1IQrKlHTJ3BnCS00ZHrk2HTjyXO/view
Мне удалось настроить массив (2000,2,5,52), однако код «для цикла», написанный для извлечения различных столбцов из прогнозируемых значений вероятности, представляется проблематичным.
dat<-read.csv("allsamp.csv")
A<-array(0, c(2000,2,14,5,52))
for ( i in 1:2){
for (j in 1:14){
for (k in 1:5){
for (l in 1:52){
A[,i,j,k,l] <-dat['pre[,i,j,l,k]']
}}}}
#District level predicted probability
res<-rep(0,2000*52)
for (i in 1:52) {
res[i]<-A(sum[1:2000, 1:2, 1:14, 1:5, i])
}
Я ожидаю, что выходные данные "NA" в вычислении массива будут действительными значениями.
Как только массив будет правильно рассчитан, будут сгенерированы оценки уровня района для вычисления средних значений уровня района и вероятного интервала 95%.