Я работаю над набором данных радужной оболочки и пытаюсь реализовать метод один против всех, используя классификатор knn. Я немного сбит с толку, потому что не знаю, реализую ли я технику один против всех, как должен. Итак, насколько я понял, если у меня есть N классов в моем наборе данных, у меня должно быть N копий набора данных с двоичными классами и N классификаторами.
Например, один набор данных будет выглядеть так: setosa (1), virginica и veriscola (-1). Другое: virginica (1), setosa, veriscola (-1).
Так вот, это та часть, которую я не понимаю. Должен ли я обучить virginica и veriscola, получить их точность, а затем проверить точность этого классификатора для setosa? Меня смущает то, что при обучении virginica и veriscola я получаю точность 1,0, а для теста (сетоза) - 0,0. Это относится ко всем 3 возможным классификаторам и различным наборам данных.
Должен ли я выполнить трехкратную перекрестную проверку всего набора данных с двумя классами?
Я немного застрял, надеюсь, вы поможете мне лучше понять.