Критерий ExtraTreesRegressor - PullRequest
1 голос
/ 17 июня 2020

Насколько я понимаю, ExtraTreesRegressor из sklearn работает путем случайного разбиения вместо минимизации метри c, например, gini для классификации или mae для регрессии.

Я не понимаю, почему существует criterion параметр, поскольку критерий разбиения должен быть случайным.

Это просто для совместимости кода, или я что-то упустил?

1 Ответ

1 голос
/ 19 июня 2020

Я думаю, вы неправильно поняли, что это за сплиты случайно. Согласно Руководству пользователя для чрезвычайно рандомизированных деревьев:

Как и в случайных лесах, используется случайное подмножество функций-кандидатов, но вместо поиска наиболее различающих пороговых значений

пороговые значения выбираются случайным образом для каждой функции-кандидата

и

лучшие из этих случайно сгенерированных пороговых значений выбрано в качестве правила разделения .

Дополнительная рандомизация ExtraTreesRegressor касается пороговых функций-кандидатов. Но еще предстоит определить, какая из них обеспечивает лучший раскол. И поэтому вам все еще нужен criterion, определяющий функцию для оценки качества разделения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...