кластеризация k-средних не сферическая - PullRequest
0 голосов
/ 24 января 2019

Я новичок в науке о данных, и мне нужна ваша помощь. Я пытаюсь проверить неконтролируемое машинное обучение с помощью K-средних, но обнаружил, что результат не сферический.Я нормализовал, я удалил выбросы и т.д. Я попытался найти несколько способов исправить это, но он не работает

Вот изображения: (Я взял небольшой образец набора данных, чтобы показать вам, это на самом деле 8000ряды)

enter image description here ... enter image description here

Ответы [ 2 ]

0 голосов
/ 24 января 2019
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

pca = PCA(n_components=2)

principalComponents = pca.fit_transform(df)

principalDf = pd.DataFrame(data = principalComponents, columns = ['principal component 1', 'principal component 2'])

principalDf.head(5)

Я использовал PCA, чтобы уменьшить размеры 6 до 2: Он отлично разделяет данные

Выход: Output

0 голосов
/ 24 января 2019

Ваши данные имеют 6 измерений. Вы не можете визуализировать данные выше 2-х измерений прямым способом, вам нужно использовать PCA или TSNE для их визуализации.

...