Как я могу проанализировать фрагменты текста на наличие положительных или отрицательных слов? - PullRequest
1 голос
/ 13 января 2011

Я ищу какой-то модуль (предпочтительно для python), который позволил бы дать этому модулю строку длиной около 200 символов.Затем модуль должен вернуть количество положительных или отрицательных слов в этой строке.(например, любовь, нравится, нравится против ненависти, неприязни, плохого)

Я бы очень хотел избежать необходимости изобретать велосипед в обработке естественного языка, так что, если вы знаете что-нибудь, это позволилочтобы я сделал то, что я описал выше, было бы здорово сэкономить время, если бы вы могли поделиться.

Спасибо за помощь!

Ответы [ 3 ]

2 голосов
1 голос
/ 11 декабря 2013

Прежде чем анализировать фрагменты текста, вам необходимо предварительно обработать заданный текст, удалив пунктуацию, исправить язык, разделить пробелы, уменьшить весь текст и сохранить слова в итерируемой структуре данных.

Для базового анализа настроений можно использовать следующие методы:

Мешок слов

В методе мешка слов мы, в основном, просматриваем мешок (файл) слов и проверяем, содержат ли они итерацию, сделанную нами. Если это так, то мы присваиваем какое-то значение присутствию каждого слова, чтобы взвесить общее настроение текста. Эта ссылка должна помочь вам понять больше об этом https://en.wikipedia.org/wiki/Bag-of-words_model

Извлечение и маркировка ключевых слов

Ключевые слова и важную информацию можно извлечь из входного текста, пометив элементы и удалив ненужные данные. Например: Меня зовут Джон. Здесь Джон, имя - это информация, а «есть» на самом деле не нужно. Точно так же можно удалить глаголы и другие неважные вещи, чтобы сохранить только основную информацию. Chunking и Chinking помогают. Эта ссылка должна быть полезной. http://nltk.org/book/ch07.html

0 голосов
/ 24 ноября 2018

Вы можете маркировать свой текст и получать настроения с помощью существующих инструментов анализа настроений.Самый полный инструмент анализа настроений, который я знаю, это SentiBench .Это в основном обзорное исследование всех инструментов анализа настроений.А также код и примеры того, как использовать код.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...