R пакеты / модели, которые могут обрабатывать NA - PullRequest
5 голосов
/ 11 декабря 2011

Я ищу R-пакеты или модели / алгоритмы машинного обучения, такие как randomForest, glmnet, gbdt и т. Д., Которые могут обрабатывать NA, а не игнорировать строку или столбец, в которых есть какие-либо экземпляры NA.Я не ищу вменения.Есть предложения?

1 Ответ

4 голосов
/ 11 декабря 2011

Алгоритм CART обрабатывает NA довольно легко (пакет rpart ).Тогда вы всегда можете обратиться к деревьям в мешках , используя rpart, возможно, через пакет ipred .

Я слышал, что многовариантные сплайны адаптивной регрессии (marsв пакете mda ) хорошо обрабатывает отсутствующие данные, хотя я не очень разбираюсь в этом.

Кроме того, k моделей ближайших соседей (и, как мне кажется, более общих методов ядра) могутбыть изменен, чтобы иметь дело с отсутствующими значениями довольно простым способом, но реализации могут не делать это из коробки.Но, вероятно, это было бы так же просто, как настроить метрику расстояния, чтобы рассматривать только попарно полные случаи.Я менее знаком с конкретными пакетами R, которые делают больше, чем модели vanilla knn.

...