Я работаю над проектом данных, который требует, чтобы я сравнивал результаты после выполнения с различными значениями k.Мой набор данных состоит из 33887 образцов и 2304 объектов.Чтобы сделать это, я просто сравниваю процент точности между экспериментами с различными значениями k.По какой-то странной причине все проценты кажутся относительно одинаковыми.
Вот моя конфигурация и функции, которые я использую, чтобы получить свои прогнозы для последующего вычисления точности:
knc = KNeighborsClassifier(algorithm='ball_tree', n_neighbors=3, weights='distance')
knc.fit(features, classes)
pred_list = knc.predict(test_features)
И тогда я сделаю то же самое, но с 5 соседями, затем с7 соседей.Моя точность (с моим конкретным набором данных) всегда составляет около 40%, независимо от значения k.Я что-то не так делаю?