У меня есть сценарий Python, который создает облако слов из 12 лучших слов / фраз, найденных в документе. Я пытаюсь взять 5 лучших результатов этого облака слов и добавить его в словарь стоп-слов. Запустите этот скрипт еще раз и создайте облако слов, которое иллюстрирует термины, которые показывают наиболее часто используемые слова / термины в мире от 6 до 17.
Я могу получить список этих самых популярных 5 слов, но я получаю сообщение об ошибке при попытке присоединить эти слова к словарю STOPWORDS с помощью индекса базы данных.
Мои библиотеки:
import numpy as np
import pandas as pd
from os import path
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import matplotlib.pyplot as plt
full_text - это мой фрейм данных
wordcloud = WordCloud(stopwords = stopwords, max_font_size = 50, max_words=12, background_color = "white").generate(full_text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
Затем я пытаюсь добавить стоп-слова, используя приведенную ниже часть, но, очевидно, это не работает.
stopwords.add(print('"',top_word_freq['word'][2],'"', sep = ""))
stopwords.add(print('"',top_word_freq['word'][2],'"', sep = ""))
stopwords.add(print('"',top_word_freq['word'][3],'"', sep = ""))
stopwords.add(print('"',top_word_freq['word'][4],'"', sep = ""))
stopwords.add(print('"',top_word_freq['word'][5],'"', sep = ""))
Тогда я бы просто запустил здесь тот же скрипт облака слов
wordcloud = WordCloud(stopwords = stopwords, max_font_size = 50, max_words=12, background_color = "white").generate(full_text)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
Есть идеи, как добавить таким образом стоп-слова в словарь стоп-слов?