как кластеризовать клиентов, если у них есть данные, разбитые по дням - PullRequest
0 голосов
/ 14 октября 2019

Я хочу кластеризовать клиентов на основе данных, разбитых по дням, с помощью K-Means-Clustering. Данные имеют одинаковые типы значений по дням. Но я не знаю, как организовать данные или какие параметры модели установить, чтобы сделать это правильно и как визуализировать результаты (использовать 2D или 3D диаграмму).

Я пытался кластеризовать данные на4, 6, 8 кластеров, но это всегда дало мне только 3 видимых кластера (возможно, кластеры были - друг под другом).

kmeans = KMeans(n_clusters=4, init='k-means++').fit(df)
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=300, c='red')

Когда я углубился в результаты кластеризации, я обнаружил, что модель кластеризуется не по изменчивости, а по отсутствующим значениям (которые были заменены нулями). Например: 1-й класс - клиенты с данными за все дни, 2-й класс - с данными за пол дня, 3-й класс - с данными за четверть дня.

ЖелательноРезультатом является то, что каждый клиент будет частью одной из n-групп в соответствии с изменчивостью данных по дням. И что результат будет визуализирован. dataresult of clustering

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...