Допустим, я запускаю случайный лес (RFA) для набора данных с целевой переменной с 3 классами.Я хочу, чтобы подход ROC "один против всех" (OVA) позволил получить окончательный многоуровневый AUC (давайте пока проигнорируем, как я получу окончательный AUC, если у меня будет 3 AUC OVA).
Должен ли я:
(1) для каждой OVA, измените мою целевую переменную на бинарную, например, «classI» против «других», выполните RFA, затем выполните ROC и вычислите AUC
(2) run1 RFA с исходной целевой переменной (3 класса), а затем изменить мои прогнозы на двоичные, например, «classI» против «других» для каждого OVA, затем выполнить ROC и вычислить AUC
В обоих случаях я будуосталось 3 РПЦ, 3 АУК, как и планировалось.
Я нигде не вижу этого явного, хотя я предполагаю, что каждый имеет в виду (2).
Почему (2) лучше?
Спасибо!