Статистика: Точность алгоритма KNN для K = 1 - PullRequest
0 голосов
/ 23 ноября 2018

Это действительно общий вопрос об алгоритме KNN, который, надеюсь, вы сможете помочь мне понять.

Я использую алгоритм knn в классе библиотеки в R:

knn <- knn (train = X_train, test = X_test, cl = train_Y, k = 3) </p>

При запуске алгоритма KNN для классификации рукописных цифр от 0 до 9 (каждое наблюдение представляет собой текстовый файл с 1024 0 си 1с создание картины числа).Таким образом, это набор данных с 1024 переменными, и каждая из них может быть 0 или 1.

Я могу запустить алгоритм и получаю очень хорошие результаты с K = 3 (как-то разумно).Однако, когда я перебираю различные значения K в поисках оптимального значения, случается, что оптимальные значения K равны 1 или 3, а затем постепенно снижаются.

То, что я нахожу странным, это тот факт, что K = 1 можетбыть оптимальным значением, поскольку я не нахожу разумным, что оптимальным значением будет рассмотрение только ближайшей точки.

Можете ли вы помочь мне в этом вопросе?Может ли это быть из-за аргумента use.all = TRUE?

...