Как сделать облако слов для каждого кластера в kmeans - PullRequest
0 голосов
/ 17 июня 2019

"Я пытаюсь напечатать точки данных в каждом кластере, используя облако слов, и мои точки данных - это данные векторизатора (BOW), Как напечатать слова в каждом кластере, используя облако слов ..?"

Я уже сделалОптимальное k для k-средних После этого я не понимаю, как печатать слова в каждом кластерепечатать слова для каждого кластера, используя облако слов

Ответы [ 2 ]

0 голосов
/ 19 июня 2019
from wordcloud import WordCloud, STOPWORDS 
import matplotlib.pyplot as plt 
import pandas as pd 

for tag  in  y_kmeans.labels_ :
if tag==1:
  tags1=element+" "+element[tag]
if tag==2:
  tags2=element+" "+element[tag]
if tag==3:
  tags3=element+" "+element[tag]

  wordcloud = WordCloud(width = 1000, height = 1000, 
            background_color ='white', 
            min_font_size = 14).generate(tag1) 

        plt.figure(figsize = (10, 10), facecolor = None) 
        plt.imshow(wordcloud) 
0 голосов
/ 18 июня 2019

печать y_kmeans и X сообщит вам, какая строка принадлежит какому кластеру.

kmeanModel_bow = KMeans(n_clusters=2)
y_kmeans = kmeanModel_bow.fit_predict(X)
...