yellowbrick visualiser.fit () повышает ValueError - PullRequest
2 голосов
/ 10 марта 2019

Я пытаюсь вам визуализировать график дисперсии для моих данных в твиттере

Вот ссылка на набор данных

набор данных

Это код

from yellowbrick.text import DispersionPlot

text = combine['tweet']
target_words = ht_negative_unnest

visualizer = DispersionPlot(target_words)
visualizer.fit(text)
visualizer.poof()

Я пытаюсь передать такой список в приведенном выше коде, хранящемся в ht_negative_unnest

 ['cnn',
     'michigan',
     'tcot',
     'australia',
     'opkillingbay']

Произошла ошибка

 YellowbrickValueError                     Traceback (most recent call last)
<ipython-input-114-d6a94f150164> in <module>
      7 # Create the visualizer and draw the plot
      8 visualizer = DispersionPlot(target_words)
----> 9 visualizer.fit(text)
     10 visualizer.poof()

c:\users\hp\appdata\local\programs\python\python37\lib\site-packages\yellowbrick\text\dispersion.py in fit(self, X, y, **kwargs)
    171         self.target = points_target[:,2]
    172 
--> 173         self._check_missing_words(points)
    174 
    175         self.draw(points, self.target)

c:\users\hp\appdata\local\programs\python\python37\lib\site-packages\yellowbrick\text\dispersion.py in _check_missing_words(self, points)
    119                     "The indexed word '{}' is not found in "
    120                     "this corpus"
--> 121                     ).format(self.indexed_words_[index]))
    122 
    123     def fit(self, X, y=None, **kwargs):

YellowbrickValueError: The indexed word 'wso' is not found in this corpus

1 Ответ

3 голосов
/ 22 марта 2019

Я думаю wso не найдено в вашем корпусе; только #wso.

Вы пробовали использовать одно целевое слово, например ['love']? Вы все еще получаете ошибку?

...