Я строю классификатор для некоторых 2D-данных.
У меня есть некоторые тренировочные данные, для которых я знаю классы, и нанес их на график, чтобы увидеть кластеризацию.
Кнаблюдатель, есть очевидные, отдельные кластеры, но, к сожалению, они распределены по линиям, а не в тесных кластерах.Один разброс линии идет вверх под углом около 80 градусов, другой - под углом 45 градусов, а другой - около 10 градусов от горизонтали, но все три, кажется, указывают на начало координат.
Я хочу выполнить классификацию ближайших соседей на некоторых тестовых данных, и, судя по всему, если тестовые данные очень похожи на тренировочные данные, классификатор 3 ближайших соседей будет работать нормально, кроме случаев, когда данныеблизко к началу графика, и в этом случае три кластера довольно близко друг к другу, и может быть несколько ошибок.
Должен ли я придумать некоторые предполагаемые распределения Гаусса для моих кластеров?Если так, я не уверен, как я могу объединить это с классификатором ближайшего соседа?
Буду благодарен за любой ввод.
Приветствия