Я пытаюсь найти шаблоны в пропущенных значениях в строках.
Например, если у меня есть этот набор данных:
a b c d
1 0.1 NA NA
2 NA 3 4
5 NA 6 NA
Я ожидаю, что результат будет:
n a b c d m
1 0 0 1 1 2
1 0 1 0 0 1
1 0 1 0 1 2
где столбец n показывает количество пропущенных значений строк в столбце m, а 1 указывает пропущенные значения (за исключением столбцов n и m). То есть интерпретация первой строки выходных данных выглядит следующим образом: отсутствует 1 строка 2 значения для переменных c и d; вторая строка: в 1 строке отсутствует 1 значение в переменной b и т. д.
Я пытался использовать функцию subtable () в пакете extracat (в архивной версии), но не могу найти места пропущенных значений в каждой переменной. Я могу только найти частоты.
rowmiss<-rowSums(is.na(dat1[1:ncol(dat1)]))
r1<-matrix(rowmiss, nrow=nrow(dat1))
subtable(rowmiss,1)
Я ожидаю, что результат будет таким, как показано выше. До сих пор я нахожу частоту пропущенных значений в строках, но я ожидаю паттерны и позиции пропущенных значений.