Создание WordCloud для каждого кластера в K означает кластеризацию - PullRequest
1 голос
/ 09 мая 2019

У меня есть набор BOW features, а также я знаю лучший n_clusters для использования. Мне нужна помощь в построении WordCloud для каждого кластера, чтобы мы могли анализировать слова в каждом кластере за один раз.

Пожалуйста, обратитесь к любому набору функций BOW и возьмите любой n_cluster, и я отнесу это к моей проблеме.

Рассмотрим ниже как особенности:

['aa', 'aahhhs', 'aback', 'abandon', 'abates', 'abbott', 'abby', 'abdominal', 'abiding', 'ability']

и 3 как неткластеров.

1 Ответ

0 голосов
/ 30 мая 2019

Допустим, вы подходите под свою модель:

from sklearn.cluster import KMeans
kmeans_bow = KMeans(n_clusters=3, n_jobs=-1).fit(X_train_bow)

У вашей подогнанной модели будет атрибут kmeans_bow.labels_.Это в основном говорит вам, какие точки данных были назначены для каких кластеров.Возможно, вам придется использовать kmeans_bow.labels_.tolist()

Так что следующим шагом будет использование вашего векторизатора сумок слов, чтобы получить имена объектов с помощью features = bow_vect.get_feature_names() и назначить им соответствующие метки, которые вы получили выше.

Используя цикл for, переберите свои данные и составьте список [s], который содержит слова, соответствующие каждой метке.Просто передайте эти списки в виде текста вашему классу WordCloud с любой настройкой, которая вам может понадобиться.

...