Извлечение триплетного субъекта, предиката и предложения объекта - PullRequest
13 голосов
/ 09 ноября 2011

Я пытаюсь извлечь триплетный субъект, предикат и объект из предложения. Мне нужно больше ссылок о том, как это сделать.

Ответы [ 3 ]

13 голосов
/ 14 ноября 2011

Самый простой способ сделать это с приемлемым результатом - выполнить мелкий разбор и затем извлечь тройки NOUN-VERB-NOUN. Это должно работать для всех SVO (субъект – глагол – объект) языков, таких как английский. Некоторая настройка может потребоваться для извлечения только первой тройки из предложения, или не извлекать в случае комы. Это очень быстрое решение, потому что мелкая маркировка POS обычно составляет O (n) - 0,01 на предложение, вместо глубокого анализа (Open NLP, Stanford Parser), который составляет O (n ^ 3) - 0,4 секунды на предложение.

8 голосов
/ 09 ноября 2011

вы можете использовать Stanford Parser API или Открыть NLP , чтобы сделать часть речевого тегирования и некоторых других операций NLP

, а для извлечения триплета вы можете реализовать одиниз тех методов, которые есть в статьях, доступных в интернете, я знаю, что можно реализовать: http://ailab.ijs.si/delia_rusu/Papers/is_2007.pdf

1 голос
/ 24 декабря 2014

Я работаю над аналогичной проблемой, я работаю в Visual Basic.Во-первых: у меня есть список предметов / НОУН. Во-вторых: когда я извлекаю предикат, я извлекаю фразу между ...При построении списка субъектов с существительными и именными фразами их позиции можно заменить на (шаблон обучения), тогда, если субъекты не обнаружены, возможно, ранее был обнаружен изученный предикат.

Возможно, это похоже на алгоритм снежного кома.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...