Допустим, вы подходите под свою модель:
from sklearn.cluster import KMeans
kmeans_bow = KMeans(n_clusters=3, n_jobs=-1).fit(X_train_bow)
У вашей подогнанной модели будет атрибут kmeans_bow.labels_
.Это в основном говорит вам, какие точки данных были назначены для каких кластеров.Возможно, вам придется использовать kmeans_bow.labels_.tolist()
Так что следующим шагом будет использование вашего векторизатора сумок слов, чтобы получить имена объектов с помощью features = bow_vect.get_feature_names()
и назначить им соответствующие метки, которые вы получили выше.
Используя цикл for, переберите свои данные и составьте список [s], который содержит слова, соответствующие каждой метке.Просто передайте эти списки в виде текста вашему классу WordCloud с любой настройкой, которая вам может понадобиться.