Я пытаюсь построить мультиклассовый классификатор. Из-за характера данных имеет смысл построить двухуровневую модель. Сначала у меня есть модель, предсказывающая, принадлежат ли данные классу А. Если это не так, я использую другую модель для прогнозирования класса {B, C, D}. Вторая модель обучается с точками данных, предсказанными как класс A, удаленный из набора данных.
Вместо использования жестких порогов в первом двоичном классификаторе для перехода ко второму мультиклассовому классификатору, как я могу использовать P (y_i = A) ) вместо? Как бы я тренировал вторую модель в этом случае?