У меня есть набор данных, который состоит из 2500+ информации о домах, такой как цена, площадь в квадратных футах и т. Д. c. Я хотел сгруппировать похожие дома по расположению, цене, количеству спален и ванных комнат. Итак, взяв эти 4 в качестве входных параметров, я применил кластеризацию k-средних и для определения количества кластеров (то есть значения k) я использовал метод анализа силуэта и получил k = 208 как тот, у которого лучший показатель силуэта, поэтому разделенный мой набор данных в 208 кластеров с кластеризацией K-средних. Теперь я создал одну выборку данных со случайным расположением, ценой, количеством спален и ванных комнат и предсказал номер кластера, к которому принадлежит эта выборка, и проанализировал точки данных этого кластера. Моя проблема в том, что я также хочу проанализировать точки данных кластера (кластеров), наиболее похожих на созданный мной экземпляр одного образца. Как мы можем это сделать?