Вы не обязательно делаете что-то не так.
Если присмотреться к теоретическим кривым, которые вы показываете, вы заметите, что горизонтальная ось не содержит ни малейшего указания на фактическое количество деревьев / итераций, гдетакой минимум должен случиться.И это довольно общая черта таких теоретических предсказаний - они говорят вам, что чего-то ожидают, но ничего о том, где именно (или даже приблизительно) вы должны этого ожидать.
Имея это в виду, единственное, что я могуИсходя из вашего второго сюжета, можно сделать вывод, что в конкретном диапазоне ~ 800 деревьев, которые вы пробовали, вы все еще находитесь в «левом» от ожидаемого минимума.
Опять же, нет теоретического предсказания того, сколькодеревья (800 или 8000 или ...), которые вы должны добавить до достижения этого минимума.
Чтобы внести эмпирическое подтверждение в обсуждение: в моем первом первом конкурсе Kaggle мы продолжали добавлять деревья, пока не достигли ряда~ 24,000 , до того как наша ошибка проверки начала расходиться (мы использовали GBM, а не RF, но обоснование идентично).