Отфильтруйте ненужные слова (например, слова без коннотации) - PullRequest
0 голосов
/ 07 мая 2020

Итак, я работаю над проектом, в котором мне нужно обрабатывать большое количество отзывов на Amazon. Как мне go сократить каждый отзыв до пары основных слов? Как только слова с сильным подтекстом, положительным и отрицательным. Спасибо!

1 Ответ

0 голосов
/ 07 мая 2020

В nlp это обычно называется анализом настроений. Прежде всего, поиск положительных или отрицательных слов может быть сложной задачей из-за двусмысленности. В обзорах Amazon у вас также есть рейтинг - это означает, что ваши данные помечены (так, что оценка в 1 звезду означает, что обзор отрицательный, а оценка в 5 звезд - положительный отзыв).

Я предлагаю вместо поиск слов, которые положительно коррелируют с настроением, чтобы удалить слова, не влияющие на настроение. т.е. очистка данных. в nlp наиболее распространенными способами являются остановка и удаление стоп-слов. после того, как вы сделали эти два, вы бы удалили большую часть шума. Кроме того, вы можете извлечь выгоду из извлечения функций из данных, общая функция называется tf-idf.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...