После перекрестной проверки, когда я тренирую модель, используя gl mnet, я пытаюсь предсказать вероятности на тестовых данных. Для некоторых наблюдений это работает, однако для других он возвращает NaN
значения
Мои исходные данные тренировки имеют около 6000 наблюдений и 12000 измерений. Я пытаюсь предсказать более 5 категорий:
glmnet(as.matrix(covariates), as.matrix(response), alpha =1, family = "multinomial", lambda = 0.01)
возвратов, например:
0,000000e + 00 0,000000e + 00 0,000000e + 00 0,000000e + 00 NaN
2.172089e-28 4.700428e-28 1.838316e-37 1.391421e-28 1.000000e + 00
CV находит оптимальное значение лямбды 0,01, однако при попытке использовать более высокие значения лямбды он не возвращает NaN
s
После уменьшения размерности модель, обученная на сокращенном наборе размерных данных, кажется только предсказывает 0 и NaN
. Возвраты, например:
0 0 0 0 NaN
NaN NaN NaN NaN NaN