Классификация случайных лесов, данные тренировочного теста - PullRequest
0 голосов
/ 23 сентября 2018

Я новичок в среде машинного обучения.Я заметил, что классификатор случайных лесов состоит из деревьев решений, которые полагаются на статистику для классификации выборки.может ли случайный лес ошибочно классифицировать выборку, которая была в его тренировочном наборе?

1 Ответ

0 голосов
/ 23 сентября 2018

Да.Если глубина деревьев решений не достаточно велика, чтобы охватить сущность данных.Например, давайте рассмотрим данные с двумя функциями X1 и X2.

target = 1 if X1 >5 and X2 > 10, else target = 0

При глубине 1 дерево решений должно опираться только на одну из функций.

Например,В примере, если дерево решений использует функцию X1 для построения разделения, обе выборки (7, 15) и (7, 7) будут классифицированы как 1, что неправильно для (7,7), поскольку X2 = 7 < 10.

...