У меня есть набор данных с 1 миллионом строк.
При запуске 1 случайного леса выживания, содержащего 500 деревьев, с пакетом randomForestSRC в R это занимает много времени из-за проблем с памятью.
Итак, могу ли я запустить 10 случайных лесов выживанияс 50 деревьями на одних и тех же данных, каждый раз с разными семенами и усредняя результаты по 10 случайным лесам (путем деления на 10), так что я могу получить достаточно сходный результат с тем, что с 500 деревьями?