У меня есть набор данных о клиенте, содержащий около 20-25 атрибутов о клиенте, таких как:
- age
- sex_F
- sex_M
- num_purchases
- loyalty_status_new
- loyalty_status_intermediate
- loyalty_status_advanced
- ...
Я очистил свой набор данных, чтобы не иметь никакихнулевые значения и имеют однозначно закодированные категориальные переменные, а также в панду dataframe my_df.Я использовал kmeans scikit-learn для создания 2 кластеров в этом наборе данных, но я хотел бы понять, как определить, какие клиенты были кластеризованы в какие кластеры.
scaler = StandardScaler()
my_df_scaler = scaler.fit_transform(my_df)
kmeans = KMeans(2)
model = kmeans.fit(my_df_scaler)
preds = model.predict(my_df_scaler)
В основном, я ищу некоторую помощь вполучать такие идеи, как:
- Кластер 1 представляет людей с большими значениями для возраста и лояльности_status_new
Заранее спасибо!