Лечить нулевые частоты в вглм? - PullRequest
0 голосов
/ 19 июня 2020

У меня есть набор данных, как показано ниже. (IV - независимые переменные, а low, mid, high - зависимые переменные)

             IV1   IV2     IV3   low   mid  high
           <dbl> <dbl>    <dbl> <dbl> <dbl> <dbl>
1              0     0        0     0     0     0
2              0     0        1    23    29    46
3              0     1        0     0     0     0
4              1     0        0    28     1     2
5              0     1        1     9     1     0
6              1     1        0     0     0     0
7              1     0        1   112    63    67
8              1     1        1    25     2     1

Используя этот набор данных, я хочу запустить полиномиальную регрессию (кумулятивное lo git). Проблема в том, что у меня есть и нулевая частота дискретизации, и структурные нулевые частоты. Низкие, средние, высокие из строк 1, 3 и 6 являются структурными нулевыми частотами, которые логически должны быть нулевыми. С другой стороны, значение в 6-й строке и 6-м столбце - это случайная частота; если я увеличу свой образец, я, вероятно, получу значения, отличные от нуля.

Я пытаюсь использовать команду vglm() из пакета VGAM. По сути, мой вопрос в том, как мне относиться к случайным и структурным нулевым частотам для команды vglm()? У меня есть пара учебников по категориальному анализу, в них говорится только об общих решениях (например, о замене нуля выборки на очень маленькое число). Ни один из них не говорит о том, как мне обрабатывать нулевую частоту дискретизации и частоту структурного нуля, чтобы получить допустимый результат с помощью команды vglm().

Кроме того, я пробовал команду ниже, после чего она выдала сообщение об ошибке.

vglm(cbind(low, mid, high)~IV1+IV2+IV3, data=data4, family=cumulative(parallel = T))

Error in cm.VGAM(matrix(1, M, 1), x = x, bool = TRUE, apply.int = FALSE,  : 
  the 'assign' attribute is missing from 'x'; this may be due to some missing values
In addition: Warning message:
In eval(process.categorical.data.VGAM) :
  Deleted 3 rows of the response matrix due to zero counts

Кто-нибудь знает решение этой ошибки?

...