Алгоритм CART обрабатывает NA довольно легко (пакет rpart ).Тогда вы всегда можете обратиться к деревьям в мешках , используя rpart
, возможно, через пакет ipred .
Я слышал, что многовариантные сплайны адаптивной регрессии (mars
в пакете mda ) хорошо обрабатывает отсутствующие данные, хотя я не очень разбираюсь в этом.
Кроме того, k моделей ближайших соседей (и, как мне кажется, более общих методов ядра) могутбыть изменен, чтобы иметь дело с отсутствующими значениями довольно простым способом, но реализации могут не делать это из коробки.Но, вероятно, это было бы так же просто, как настроить метрику расстояния, чтобы рассматривать только попарно полные случаи.Я менее знаком с конкретными пакетами R, которые делают больше, чем модели vanilla knn.