Добавление 5 лучших результатов в World Cloud к функции STOPWORDS - PullRequest
0 голосов
/ 06 апреля 2020

У меня есть сценарий Python, который создает облако слов из 12 лучших слов / фраз, найденных в документе. Я пытаюсь взять 5 лучших результатов этого облака слов и добавить его в словарь стоп-слов. Запустите этот скрипт еще раз и создайте облако слов, которое иллюстрирует термины, которые показывают наиболее часто используемые слова / термины в мире от 6 до 17.

Я могу получить список этих самых популярных 5 слов, но я получаю сообщение об ошибке при попытке присоединить эти слова к словарю STOPWORDS с помощью индекса базы данных.

Мои библиотеки:

 import numpy as np

 import pandas as pd

 from os import path

 from PIL import Image

 from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

 import matplotlib.pyplot as plt

full_text - это мой фрейм данных

 wordcloud = WordCloud(stopwords = stopwords, max_font_size = 50, max_words=12,            background_color = "white").generate(full_text)

 plt.imshow(wordcloud, interpolation='bilinear')

 plt.axis("off")

 plt.show()

Затем я пытаюсь добавить стоп-слова, используя приведенную ниже часть, но, очевидно, это не работает.

 stopwords.add(print('"',top_word_freq['word'][2],'"', sep = ""))
 stopwords.add(print('"',top_word_freq['word'][2],'"', sep = ""))
 stopwords.add(print('"',top_word_freq['word'][3],'"', sep = ""))
 stopwords.add(print('"',top_word_freq['word'][4],'"', sep = ""))
 stopwords.add(print('"',top_word_freq['word'][5],'"', sep = ""))

Тогда я бы просто запустил здесь тот же скрипт облака слов

 wordcloud = WordCloud(stopwords = stopwords, max_font_size = 50, max_words=12, background_color = "white").generate(full_text)

 plt.imshow(wordcloud, interpolation='bilinear')

 plt.axis("off")

 plt.show()

Есть идеи, как добавить таким образом стоп-слова в словарь стоп-слов?

...