У меня есть набор данных, как показано ниже. (IV - независимые переменные, а low, mid, high - зависимые переменные)
IV1 IV2 IV3 low mid high
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 0 0 0 0 0 0
2 0 0 1 23 29 46
3 0 1 0 0 0 0
4 1 0 0 28 1 2
5 0 1 1 9 1 0
6 1 1 0 0 0 0
7 1 0 1 112 63 67
8 1 1 1 25 2 1
Используя этот набор данных, я хочу запустить полиномиальную регрессию (кумулятивное lo git). Проблема в том, что у меня есть и нулевая частота дискретизации, и структурные нулевые частоты. Низкие, средние, высокие из строк 1, 3 и 6 являются структурными нулевыми частотами, которые логически должны быть нулевыми. С другой стороны, значение в 6-й строке и 6-м столбце - это случайная частота; если я увеличу свой образец, я, вероятно, получу значения, отличные от нуля.
Я пытаюсь использовать команду vglm()
из пакета VGAM. По сути, мой вопрос в том, как мне относиться к случайным и структурным нулевым частотам для команды vglm()
? У меня есть пара учебников по категориальному анализу, в них говорится только об общих решениях (например, о замене нуля выборки на очень маленькое число). Ни один из них не говорит о том, как мне обрабатывать нулевую частоту дискретизации и частоту структурного нуля, чтобы получить допустимый результат с помощью команды vglm()
.
Кроме того, я пробовал команду ниже, после чего она выдала сообщение об ошибке.
vglm(cbind(low, mid, high)~IV1+IV2+IV3, data=data4, family=cumulative(parallel = T))
Error in cm.VGAM(matrix(1, M, 1), x = x, bool = TRUE, apply.int = FALSE, :
the 'assign' attribute is missing from 'x'; this may be due to some missing values
In addition: Warning message:
In eval(process.categorical.data.VGAM) :
Deleted 3 rows of the response matrix due to zero counts
Кто-нибудь знает решение этой ошибки?