У меня есть такой фрейм данных:
new categoryname
0 screwed screwed screwed screwed screwed screwe... agr
1 family family family family family family opn
2 partying partying partying partying partying p... agr
3 love love love love love love neu
Я хочу визуализировать этот фрейм данных, используя scattertext
. Тем не менее, примеры, которые я вижу в inte rnet, являются двоичными (демократ против republi c или положительный против отрицательного).
Мне было интересно, есть ли способ визуализации набора данных нескольких классов, как описано выше ?
Я пробовал это:
corpus = st.CorpusFromParsedDocuments(df, category_col='categoryname', parsed_col='new').build()
html = st.produce_scattertext_explorer(corpus,
category='categoryname',
category_name='categoryname',
not_category_name='new',
width_in_pixels=1000,
minimum_term_frequency=5,
transform=st.Scalers.scale,
metadata=df['new'])
Но возникает ошибка:
AttributeError: ("'str' object has no attribute 'sents'", 'occurred at index 0')
Я не уверен, что это правильный способ сделать это. Потому что в примерах они дают название категории (демократ, недемократ). Но у меня есть несколько категорий.
Есть идеи, как это исправить? Я хочу a visualization tool
, который показывает текст (кроме облака слов).