Не имея набора данных, я бы предложил следующее:
Поскольку load_svmlight_file()
возвращает разреженную матрицу, превращает X
в массив NumPy, используя samples = X.toarray()
перед подгонкой модели.
Постройте две характеристики (например) набора данных, используя: plt.scatter(samples[:,0], samples[:,1], c=labels)
. Это окрашивает кластеры в соответствии с их предсказанными метками.
Затем введите plt.scatter(centroids[:,0], centroids[:,1], marker='D')
, чтобы увидеть расположение центроидов с ромбами.
Обратите внимание, что , что samples[:,n]
представляет собой массив, содержащий примерные значения для n
th функции набора данных.
Надеюсь, это поможет. Если нет, дайте мне знать.