Мое понимание повышения градиента таково ...
Мы можем сделать модель намного более сложной, создав множество деревьев решений последовательно. Каждое дерево решений строится друг на друге. Цель каждого нового дерева - исправить ошибки, в которых предыдущие деревья наиболее ошибочны. Если у нас было 3000 деревьев решений, это означает, что ошибки минимизируются 3000 раз. К концу мы бы уменьшили ошибки.
Есть ли какая-то ошибка в моем понимании?