Стоп-слова обычно создаются на основе анализа наиболее распространенных слов в языке (это основная причина, по которой там присутствует «не»). Идея, стоящая за ними, состоит в том, чтобы позволить анализу (обычно подход с использованием набора слов) сосредоточиться на наиболее интересных словах документа.
Они используются для нескольких целей: они не были разработаны специально для анализа тональности. Это еще одна причина, по которой здесь присутствует «не».
Пакет слов к анализу настроений всегда будет немного грубым, со стоп-словами или без них. Например, нетрудно создать реалистичные c -звучные положительные mov ie обзоры, используя отрицательные слова:
«Этот mov ie был совсем не тем, что я ожидал: я обычно ненавижу Тома Круза, но он заставил этот mov ie работать. "
" Я никогда не смотрю цыплят, но, как говорится, никогда не говори никогда. "
В любом случае попробуйте настроить список стоп-слов, удалив" не " и «никогда», чтобы увидеть, улучшит ли это результаты. Затем попробуйте еще раз, не используя игнорируемые слова.