Создание Wordcloud из фрейма данных - PullRequest
0 голосов
/ 09 апреля 2020

Предположим, что в правом столбце у нас есть количество раз, когда каждая окрестность появляется. Я хочу создать облако слов для данного фрейма данных. Но когда я пытался его создать, окрестности, такие как Neos Kosmos или Akadimia Platonos , разделялись как разные слова, приводящие к пробелу между словами, составляющими название района

Это код, который я написал

wordcloud = WordCloud(width = 3000,height = 2000,background_color = 'white',stopwords = 
STOPWORDS).generate(str(df))
fig = plt.figure(figsize = (10, 30),facecolor = 'k',edgecolor = 'k')
plt.imshow(wordcloud, interpolation = 'nearest')
plt.axis('off')
plt.tight_layout(pad=0)
plt.show()    
neighbourhood value
Plaka          1216
Neos Kosmos    952
Koukaki        883
Pangrati       683
Kolonaki       650  
Akadimia Platonos 555

Ответы [ 2 ]

0 голосов
/ 09 апреля 2020

Я попробовал это с wordcloud.fitwords (df) , и это сработало !!!! Все равно спасибо!

0 голосов
/ 09 апреля 2020

Вы можете использовать value_counts в своей серии, а затем использовать generate_from_frequencies Wordcloud для создания вашего облака

my_list=['bat','cat','rat','gnat']

ser=pd.Series([' '.join([choice(my_list),choice(my_list)]) for i in range(100)])

ser.head()
0    bat cat
1    bat cat
2    rat rat
3    rat rat
4    rat rat

w=wordcloud.WordCloud().generate_from_frequencies(ser.value_counts())

plt.imshow(w)

WordCloud of Frequencies

...