о значении параметра KNN K - PullRequest

1 Ответ

0 голосов
/ 30 марта 2020
  1. Первый вариант предпочтителен, поскольку он использует перекрестную проверку для проверки точности (как правило, производительности) значения k, поэтому наилучшая точность K в первом методе больше c. KNN очень чувствителен к локальному минимуму, поэтому вам определенно нужна техника перекрестной проверки больше, чем всегда.

  2. Вы должны сравнивать два метода с одинаковыми метриками, поэтому составьте график точности для них обоих.

  3. По-видимому, наилучшее значение K встречается где-то около 15-20, потому что на обоих графиках лучшая производительность. Я рекомендую вам попробовать перекрестную проверку для k в диапазоне (15-20) с более высоким значением сгиба (в первом методе cv >> 10)

  4. Рассмотрим это топи c о переоснащении и значении k.

...