Классификация с алгоритмом J48 и IBk (KNN) - PullRequest
1 голос
/ 13 января 2012

Я дал запись с множеством разных видов грибов.Их следует классифицировать на съедобные и ядовитые.Классификация должна выполняться с k-ближайшими соседями (1) и J48.

Оба алгоритма показывают точность 99,88%.Для меня важен ложноположительный показатель.J48 имеет ставку 0,3% и KNN 0%.Поэтому я бы сказал, что KNN лучше подходит для выбранной задачи.

Однако я не знаю ответа, почему.Есть ли общий ответ, почему KNN для некоторых записей лучше, чем J48?

Во-вторых, я должен использовать перекрестную проверку в 10 раз.Что это точно?

Заранее спасибо

1 Ответ

1 голос
/ 13 января 2012

Есть ли общий ответ, почему KNN для некоторых записей лучше, чем J48?

Нет.Это сильно зависит от набора данных, настроек обоих алгоритмов и способа проведения оценки (вы использовали отдельные наборы обучения и тестирования, не так ли?).

10-кратная перекрестная проверка означает: вы разбиваете свой набор данных на 10 одинаковых по размеру «сгибов», затем для каждой из этих сгибов i

  • поезд на всех остальных девяти сгибахсложите i

и возьмите среднюю точность.См. Википедию или любую книгу по машинному обучению.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...