Есть ли способ получить тему предложения с помощью OpenNLP? - PullRequest
13 голосов
/ 05 апреля 2011

Есть ли способ получить тему предложения с помощью OpenNLP?Я пытаюсь определить наиболее важную часть предложения пользователей.Обычно пользователи будут отправлять предложения нашему «движку», и мы хотим точно знать, что является основной темой этого предложения.

В настоящее время мы используем openNlp для:

  1. Chunkпредложение
  2. Определить существительное-фразу, глаголы и т. д. предложения
  3. Определить все "темы" предложения
  4. (НЕ ДАЕТ!)тема "предложения

Пожалуйста, дайте мне знать, если у вас есть какие-нибудь яркие идеи ..

Ответы [ 2 ]

17 голосов
/ 06 апреля 2011

Анализатор зависимостей

Если вы заинтересованы в извлечении грамматических отношений, например, какое слово или фраза является предметом предложения, вам действительно следует использовать анализатор зависимостей .Хотя OpenNLP поддерживает синтаксический анализ структуры фраз, я не думаю, что он пока анализирует зависимости.

Программное обеспечение с открытым исходным кодом

Пакеты, написанные на Java, которые поддерживают анализ зависимостей, включают:

Из них Stanford Parser является наиболее точным.Однако некоторые конфигурации MaltParser могут быть безумно быстрыми ( Cer et al. 2010 ).

2 голосов
/ 23 декабря 2011

Для грамматического предмета вам нужно полагаться на информацию о конфигурации в дереве. Если анализ выглядит примерно так (TOP (S (NP ----) (VP ----))), то вы можете взять NP в качестве субъекта; часто, хотя и не всегда, так будет. Однако только некоторые предложения будут иметь эту конфигурацию; можно легко представить структуры с объектами, которые не находятся в этом положении - например, пассивные конструкции.

Возможно, вам лучше использовать MaltParser.

...