Классификация неравномерно выбранных данных с использованием KNN - PullRequest
1 голос
/ 27 апреля 2019

У меня есть набор данных, где у меня есть 360 samples для class 0 и только 44 samples для class 1.Когда я подгоняю KNN model к данным, используя k=3, модель ошибочно классифицирует множество образцов как class 0.Каков наилучший способ справиться с такими неравномерно выбранными данными?Я мог бы установить k=1, но из того, что я прочитал, я получаю сильный шум.

1 Ответ

0 голосов
/ 27 апреля 2019

Проверьте это обсуждение на CrossValidated, особенно третий ответ.Один из упомянутых подходов, например, состоит в том, чтобы взвешивать соседей «с точностью до величины их класса».В вашем примере с k=3 это будет означать, что в ситуации, когда два ближайших соседа - class 0, а один ближайший сосед - class 1, метка будет class 1, так как 1/44> 2/360.Это только один подход, и вы можете проверить больше подходов в обсуждении, связанном выше.Надеюсь, это поможет!

...