Метод случайных подпространств в R - PullRequest
0 голосов
/ 25 сентября 2019

Есть идеи о том, как реализовать «метод случайного подпространства» (метод ансамбля), как описано (Ho, 1998) в R?Не могу найти пакет

Хо, Тин Кам (1998).« Метод случайных подпространств для построения лесов принятия решений ».IEEE Транзакции по анализу образов и машинному интеллекту.20 (8): 832–844.

1 Ответ

0 голосов
/ 25 сентября 2019

С практической точки зрения, это было "интегрировано" (своего рода) в алгоритм Random Forest (RF) - это фактически случайный выбор объектов, управляемых аргументом mtry в стандартном пакете R randomForest;см. запись Википедии по RF , а также ответ (заявление об отказе: мое) в потоке SO Почему Случайный лес с одним деревом намного лучше, чем классификатор Дерева решений? дляподробнее ..

Хотя точная репликация поведения указанного алгоритма в реализации RF scikit-learn проста и понятна (просто установите bootstrap=False - см. связанную ветку выше), я признаюсь, что не могупридумайте способ получить то же поведение из пакета randomForest R - то есть «заставить» его не использовать загрузочную выборку, что сделает его эквивалентным методу Random Subspace;Я пробовал комбинацию replace=FALSE и sampsize=nrow(x) в функции randomForest , но, похоже, она не работает ...

В общем, сообщение здесь(и, возможно, причина, по которой нет конкретной реализации метода в R или других средах), заключается в том, что, скорее всего, вам лучше придерживаться Случайных Лесов;если вы определенно хотите поэкспериментировать с этим, AFAIK, похоже, единственный вариант - это Python и scikit-learn.

...