Я работаю над классификационным проектом, и есть этап изучения спектральной кластеризации с использованием научного набора. Я сослался на документ, и мой код приведен ниже:
clustering = SpectralClustering(
n_clusters=clusters, assign_labels="discretize", random_state=0).fit(X)
Однако при запуске кода выдает следующие предупреждения:
/opt/anaconda3/lib/python3.7/site-packages/sklearn/manifold/_spectral_embedding.py:236: UserWarning: Graph is not fully connected, spectral embedding may not work as expected. warnings.warn("Graph is not fully connected, spectral embedding"
Я не уверен в основной причине этого. Есть у кого-нибудь идеи?
Я проверил свои данные, но нет ни нан, ни бесконечности. Мои данные имеют форму около (302, 5290) и выглядят так:
[ 0.15055 0.11407 0.18335 ... 0.713 0.5 1. ]
[ 0.27871 0.4516 0.27369 ... 0.713 1. 4. ]
...
[ 0.30854 0.18191 0.34582 ... 0.6875 1. 6. ]
[-0.11447 -0.22041 0.22015 ... 0.8074 1. 5. ]
[ 0.31118 0.44113 0.31722 ... 0.61948 0.5 5. ]]