kNN кажется относительно простым для понимания: у вас есть точки данных, и вы рисуете их в пространстве объектов (в пространстве пространственных объектов измерения 2, это то же самое, что рисование точек на графике плоскости xy). Когда вы хотите классифицировать новые данные, вы помещаете новые данные в то же пространство объектов, находите ближайших k соседей и смотрите, каковы их метки, в конечном итоге получая метки с наибольшим количеством голосов.
Так где же появляется вероятность сыграть здесь? Все, что я делаю, чтобы вычислить расстояние между двумя точками и взять метку (метки) ближайшего соседа.