С практической точки зрения, это было "интегрировано" (своего рода) в алгоритм Random Forest (RF) - это фактически случайный выбор объектов, управляемых аргументом mtry
в стандартном пакете R randomForest
;см. запись Википедии по RF , а также ответ (заявление об отказе: мое) в потоке SO Почему Случайный лес с одним деревом намного лучше, чем классификатор Дерева решений? дляподробнее ..
Хотя точная репликация поведения указанного алгоритма в реализации RF scikit-learn проста и понятна (просто установите bootstrap=False
- см. связанную ветку выше), я признаюсь, что не могупридумайте способ получить то же поведение из пакета randomForest
R - то есть «заставить» его не использовать загрузочную выборку, что сделает его эквивалентным методу Random Subspace;Я пробовал комбинацию replace=FALSE
и sampsize=nrow(x)
в функции randomForest
, но, похоже, она не работает ...
В общем, сообщение здесь(и, возможно, причина, по которой нет конкретной реализации метода в R или других средах), заключается в том, что, скорее всего, вам лучше придерживаться Случайных Лесов;если вы определенно хотите поэкспериментировать с этим, AFAIK, похоже, единственный вариант - это Python и scikit-learn.