Классификация алгоритма K-ближайших соседей - PullRequest
0 голосов
/ 01 июня 2018

На этом графике рассеяния оси x и y имеют разные масштабы.Предположим, что центр каждой фигуры является точкой данных.

scatter diagram of for pet, wild and unknown dogs

В: Какова будет классификация контрольной точки для классификатора 9-ближайших соседей, использующего этот обучающий набор, используйте обе функции?

В: На диаграмме рассеяния в верхней части страницы в любом порядке назовите класс трех ближайших соседей для левой нижней неизвестной точки, используя обе функции для вычисления расстояния.


Вот моя попытка:

1: чем выше K, 9, тем больше избирателей в каждом прогнозе и, следовательно, более устойчиво к выбросам.Большие значения K будут иметь более плавные границы принятия решения, чтобы выбрать либо Pet, либо Wild, что означает меньшую дисперсию, но повышенный уклон.

2: Используя теорему Пифагора, расстояние трех ближайших классов до нижнего левогонеизвестные точки:

  1. Пэт, расстояние = 0,02
  2. Пэт, расстояние = 2,20
  3. Дикий, расстояние = 2,60

ПоэтомуКласс Pet.

1 Ответ

0 голосов
/ 01 июня 2018

Вопрос 1 требует конкретного ответа (Pet или Wild), который вы не предоставили.Сделанные вами заявления, как правило, верны, но на самом деле они не отвечают на вопрос.Обратите внимание, что есть только 4 очка питомца, а остальные - Wild.Таким образом, независимо от того, какие 9 пунктов являются ближайшими соседями, по меньшей мере 5 (большинство) будут Wild.Следовательно, классификатор KNN с K = 9 всегда будет предсказывать Wild, используя эти данные.

Вопрос 2 выглядит в основном правильным.У меня нет точных координат точек, но ваши цифры, кажется, находятся в правильном поле, за исключением того, что вы, вероятно, опечатка на первом расстоянии.Классы верны, и полученное в результате предсказание (которое вопрос явно не задавался) также верно (при условии, что K = 3).

...