Определение сущности в анализе настроений с помощью Lingpipe - PullRequest
2 голосов
/ 29 сентября 2011

Я реализовал анализ настроений с помощью модуля анализа настроений Lingpipe.Я знаю, что для этого они используют модель Dynamic LR.Это просто говорит мне, является ли тестовая строка позитивным или негативным.Какие идеи я мог бы использовать, чтобы определить объект, к которому выражалось чувство?

Если текст относится к категории позитивных настроений, я хотел бы получить объект, для которого выражено мнение - это может быть название фильма, название продукта или другие.

Ответы [ 2 ]

4 голосов
/ 24 августа 2012

Хотя этот вопрос действительно старый, но я хотел бы ответить на него для пользы других.

Здесь вам нужен анализ настроений на уровне концепций.Для очень простой версии я бы порекомендовал следующие шаги:

  1. Применить разделитель предложений.Вы можете использовать разделитель предложений Lingpipe или OpenNLP Sentence Detector.

  2. Применить пометку части речи.Опять же, вы можете использовать POS-тегер Lingpipe или OpenNLP POS-тегер.

  3. Затем вам необходимо идентифицировать токены, идентифицируемые как ' Существительные ' тегом POS.Эти токены могут быть целевым объектом в предложении.

  4. Затем вам нужно найти слова сентиментальности в предложении.Самый простой способ сделать это - использовать словарь слов, содержащих чувства.Вы можете найти много таких словарей в Интернете.

  5. Следующим шагом будет поиск зависимостей в предложениях.Это может быть достигнуто с помощью Stanford Dependency Parser .Например, если вы попробуете предложение - « Этот телефон хорош. » в их онлайн-демонстрации , вы увидите следующие «Типизированные зависимости»:

    det (phone-2, This-1), nsubj (good-4, phone-2) , cop (good-4, is-3), root (ROOT-0, good-4)

    Зависимость nsubj (товар-4, телефон-2) здесь указывает, что телефон является номинальным субъектом токена хорошо, подразумевая, что слово good выражено для phone .Я уверен, что ваш словарь настроений будет содержать слова good и phone были бы идентифицированы как существительное с помощью POS-тегера.Таким образом, вы можете сделать вывод, что настроение хорошо было выражено для сущности телефон .

Это был очень простой пример.Вы можете пойти еще дальше и создать правила для отношений зависимости, чтобы извлечь более сложные пары чувство-сущность.Вы также можете назначить баллы вашим терминам настроений и составить общий балл для предложения в зависимости от количества появлений слов сентиментальности в этом предложении.

0 голосов
/ 29 сентября 2011

Обычно предложение чувства означает, что основная сущность такого предложения является объектом этого чувства.Так что основная эвристика заключается в том, чтобы NER и получить первый объект.В противном случае вы должны использовать инструментарий глубокого анализа NLP и написать некоторые правила, чтобы связать настроение с объектом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...