Я сделал классификатор случайных лесов (rfc), но так как мои данные состоят из 130 тыс. Строк, каждая из которых содержит 7250 столбцов, у меня недостаточно памяти для загрузки всего этого и передачи его в RFC, поэтому я ищу какой-то пакетный пакет.training.
Насколько я понимаю, использование warm_start=True
в rfc должно сделать что-то подобное.Я немного смущен, потому что, похоже, использование warm_start
заставляет i-е дерево в лесу использовать информацию из предыдущих (и нового пакета) для создания дерева i + 1.
Но так как лес состоит из нескольких деревьев и большинства голосов, тогда я действительно получаю случайный лес или это действительно одно дерево (последнее)?Если это случайный лес, то последнее дерево должно быть более точным, чем первые (если я правильно понял), и тогда оно имеет некоторый вес или ..?