Я запускаю код с около 200 000 наблюдений, где обработано 10.000, а остальные я пытаюсь сопоставить с помощью пакета MatchIt.
Из-за одной из этих переменных появляется предупреждающее сообщение, и я не знаю, должен ли я просто игнорировать его или нет. Сообщение: Glm.fit: подогнанные вероятности численно 0 или 1 произошло
Код, который я запускаю, похож на приведенный ниже:
m.out <- matchit(var ~ VAR1 + VAR2 + VAR3 + VAR4 + VAR5, data = mydata, method = "nearest", exact = c("VAR1", "VAR3", "VAR5"))
Для иллюстрации предположим, что переменная с проблемой - "VAR5". Эта переменная является символьной переменной с около 200 различными текстами. Итак, у меня вопрос, является ли это предупреждение реальной проблемой или просто потому, что в этой переменной слишком много параметров для размера моих данных, и из-за этого невозможно найти прогноз лечения / контроля? В любом случае, что я могу сделать, чтобы этого предупреждения не было?
Best,