Я дал запись с множеством разных видов грибов.Их следует классифицировать на съедобные и ядовитые.Классификация должна выполняться с k-ближайшими соседями (1) и J48.
Оба алгоритма показывают точность 99,88%.Для меня важен ложноположительный показатель.J48 имеет ставку 0,3% и KNN 0%.Поэтому я бы сказал, что KNN лучше подходит для выбранной задачи.
Однако я не знаю ответа, почему.Есть ли общий ответ, почему KNN для некоторых записей лучше, чем J48?
Во-вторых, я должен использовать перекрестную проверку в 10 раз.Что это точно?
Заранее спасибо