Влекут ли плохие результаты кластеризации плохие результаты классификации? - PullRequest
0 голосов
/ 18 января 2020

В моем проекте я пытаюсь предсказать класс с 3 возможными значениями. Перед применением любого алгоритма классификации я использовал кластеризацию и заметил, что для k = 3 существует равное распределение этих трех значений целевого класса в каждом кластере , см. Здесь . Означает ли это, что значение для класса будет трудно предсказать, потому что экземпляры с определенным значением (я пробовал также и для других значений k) не очень похожи друг на друга? Мой набор данных имеет 150 функций и 20 000 экземпляров.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...