Question

Я новичок в НЛП и просто играю с набором данных Amazon Echo Dot Reviews.

После подготовки данных я сделал FreqDist и получил следующее:

enter image description here

Что здорово, а потом я сделал Облако слов

text = " ".join(recenzje for recenzje in newdata.Review_Text)
wordcloud = WordCloud(background_color="white", max_words=300, width=1000, height=500).generate(text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()

С таким выводом:

enter image description here

Итак, все сработало нормально, но я не уверен, почему наиболее употребительные слова в FreqDist отличаются от наиболее употребительных слов в Облаке тегов?

Думаю, это как-то связано с вероятностью, но если бы кто-нибудь мог объяснить, я был бы признателен.

Заранее спасибо!

Чем FreqDist отличается от облака слов?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Чем FreqDist отличается от облака слов?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы