Если n - это число выборок и имеется m атрибутов, то обучение по дереву - это O (m * n * log n), случайный лес, который оптимизирует для наилучшего разделения, - это O (T * m * n * log n), гдеЕсть T деревьев.
Для чрезвычайно рандомизированных деревьев, где мы не оптимизируем для лучшего локального разбиения, мы отбрасываем линейную зависимость от n, поэтому это O (T * m * log n)?