Проблемы в неконтролируемом аспектном анализе настроений - PullRequest
0 голосов
/ 14 января 2020

Я работаю над неконтролируемым аспектным анализом настроений. Я попытался использовать Vader для этого, что дало мне хороший результат, но проблема в том, что если topi c отрицателен, как «пищевые отходы», то настроение всегда будет отрицательным, даже если контент говорит: «Я действительно ненавижу пищевые отходы». , Может кто-нибудь помочь мне в решении этой проблемы или даже предложить мне метод лучше, чем Вейдер. Я также пытался использовать 'Flair', но его 'результаты не такие многообещающие, как у Vader.

1 Ответ

0 голосов
/ 14 января 2020

Вероятно, модель на основе правил, которую использует VADER, не очень подходит в этом случае, в этой фразе у вас есть 3 слова, которые наверняка получат отрицательный балл (ненавижу пищевые отходы), помните, что VADER оптимизирован для кратких данных социальных сетей. и он не может получить очень хороший gr asp «контекста» фраз.

Подобный подход к VADER используется в TextBlob, который можно попробовать без особой работы: https://textblob.readthedocs.io/en/dev/

Обычно контролируемый маршрут дает лучшие результаты, но вам нужна хорошая предварительно обученная модель и хорошие данные.

Наивный байесовский классификатор в scikit-learn: https://www.datacamp.com/community/tutorials/simplifying-sentiment-analysis-python

Подход с использованием случайного леса, всегда с использованием scikit-learn: https://stackabuse.com/python-for-nlp-sentiment-analysis-with-scikit-learn/

Вот краткий обзор различных подходов к анализу настроений: https://towardsdatascience.com/fine-grained-sentiment-analysis-in-python-part-1-2697bb111ed4

...