Question

Я дал запись с множеством разных видов грибов.Их следует классифицировать на съедобные и ядовитые.Классификация должна выполняться с k-ближайшими соседями (1) и J48.

Оба алгоритма показывают точность 99,88%.Для меня важен ложноположительный показатель.J48 имеет ставку 0,3% и KNN 0%.Поэтому я бы сказал, что KNN лучше подходит для выбранной задачи.

Однако я не знаю ответа, почему.Есть ли общий ответ, почему KNN для некоторых записей лучше, чем J48?

Во-вторых, я должен использовать перекрестную проверку в 10 раз.Что это точно?

Заранее спасибо

Fred Foo · Answer 1 · 13 января 2012

Есть ли общий ответ, почему KNN для некоторых записей лучше, чем J48?

Нет.Это сильно зависит от набора данных, настроек обоих алгоритмов и способа проведения оценки (вы использовали отдельные наборы обучения и тестирования, не так ли?).

10-кратная перекрестная проверка означает: вы разбиваете свой набор данных на 10 одинаковых по размеру «сгибов», затем для каждой из этих сгибов i

поезд на всех остальных девяти сгибахсложите i

и возьмите среднюю точность.См. Википедию или любую книгу по машинному обучению.

Классификация с алгоритмом J48 и IBk (KNN)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Классификация с алгоритмом J48 и IBk (KNN)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы