Существует ли алгоритм, помогающий определить «основную тему» ​​английского предложения? - PullRequest
31 голосов
/ 05 апреля 2011

Я пытаюсь выяснить, существует ли известный алгоритм, который может определить «ключевую концепцию» предложения.

Вариант использования следующий:

  1. Пользователь вводит предложение в виде запроса (курица на вкус как индейка?)
  2. Наша система идентифицирует понятия предложения (курица, индейка)
  3. И он запускает поиск нашего содержимого корпуса

Область, в которой нам не хватает, - это определение того, о чем на самом деле является основная «тема» предложения. В предложении «Есть ли курица на вкус индейка» есть основная тема «курица», потому что пользователь спрашивает о вкусе курицы. В то время как «индейка» является вспомогательной темой меньшей важности.

Итак ... Я пытаюсь выяснить, существует ли алгоритм, который поможет мне определить основную тему предложения ... Дайте мне знать, если вам что-нибудь известно !!!

Ответы [ 12 ]

0 голосов
/ 05 апреля 2011

Простое решение состоит в том, чтобы пометить ваше предложение тегом части речи (например, из библиотеки NLTK для Python), а затем найти совпадения с некоторыми предопределенными шаблонами части речи, в которых ясно, где находится главныйпредмет предложения

0 голосов
/ 05 апреля 2011

Под «основной темой» вы имеете в виду то, что называется субъектом предложения.

Субъект может быть определен путем понимания предложения посредством обработки естественного языка.

Ответ на этот вопрос такой же, как и для Как определить предмет, объект и другие слова? - это в настоящее время нерешенная проблема.

...