Я тренируюсь с MNIST по sklearn.cluster.KMeans
.
Интуитивно, я просто подгоняю тренировочные данные к функции sklearn.Но у меня довольно низкая точность.Мне интересно, какой шаг я пропустил.Должен ли я вначале извлекать характерные векторы с помощью PCA?Или я должен поменять на n_clusters
?
from sklearn import cluster
from sklearn.metrics import accuracy_score
clf = cluster.KMeans(init='k-means++', n_clusters=10, random_state=42)
clf.fit(X_train)
y_pred=clf.predict(X_test)
print(accuracy_score(y_test, y_pred))
Я получил плохой 0.137
в результате.Любая рекомендация?Спасибо!