Как увидеть точки данных большинства кластеров, похожих на другой кластер, в кластеризации k-средних? - PullRequest
0 голосов
/ 28 мая 2020

У меня есть набор данных, который состоит из 2500+ информации о домах, такой как цена, площадь в квадратных футах и ​​т. Д. c. Я хотел сгруппировать похожие дома по расположению, цене, количеству спален и ванных комнат. Итак, взяв эти 4 в качестве входных параметров, я применил кластеризацию k-средних и для определения количества кластеров (то есть значения k) я использовал метод анализа силуэта и получил k = 208 как тот, у которого лучший показатель силуэта, поэтому разделенный мой набор данных в 208 кластеров с кластеризацией K-средних. Теперь я создал одну выборку данных со случайным расположением, ценой, количеством спален и ванных комнат и предсказал номер кластера, к которому принадлежит эта выборка, и проанализировал точки данных этого кластера. Моя проблема в том, что я также хочу проанализировать точки данных кластера (кластеров), наиболее похожих на созданный мной экземпляр одного образца. Как мы можем это сделать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...