Я понимаю, что классификатор случайных лесов использует агрегирование по деревьям решений для определения окончательной классификации.
Я читаю здесь: https://www.datascience.com/blog/classification-random-forests-in-python
«Случайный лес - это алгоритм ансамблевого дерева решений, поскольку в случае проблемы регрессии окончательный прогноз представляет собой среднее значение прогнозов каждого отдельного дерева решений; в классификации это среднее значение наиболее частого прогноза»
Мне интересно узнать, каков окончательный путь решения моего RFC, то есть, из какого дерева оно взяло среднее (кажется, что это дерево с «наиболее частыми предсказаниями»)
Я просто не уверен, что понимаю, что это означает под самыми частыми прогнозами, скажем, у меня есть 3 класса (1, 2, 3), а RFC прогнозирует класс 3 наиболее часто, означает ли это, что мета RFC будет принимать средний из всех деревьев, которые предсказали 3 класса? Это кажется интуитивно неправильным.
Может ли кто-нибудь объяснить это мне?