НЛП: морфологические манипуляции - PullRequest
1 голос
/ 18 марта 2009

Я пытаюсь построить систему NLP для назначения, для которого мне разрешено использовать внешние библиотеки.
Я использую деревья разбора, чтобы разбить предложения на составные части до существительных, глаголов и т. Д.
Я ищу библиотеку или программное обеспечение, которое позволило бы мне определить, в какой лексической форме находится слово, и, возможно, перевести его в какую-то другую форму для меня.
По сути, мне нужно что-то с такими функциями, как isPlural, singularize, getInfinitive и т. Д.
Я рассмотрел пакет Ruby Linguistics и простой Porter Stemmer (для инфинитивов), но ни один из них не очень хорош.
Это не кажется очень сложной проблемой, просто очень утомительно.
Кто-нибудь знает хороший пакет / библиотеку / программное обеспечение, которое может делать такие вещи?

1 Ответ

1 голос
/ 18 марта 2009

Как правило, для построения дерева разбора предложения необходимо сначала определить информацию о части речи и лемме слов в предложении. Итак, вы должны уже иметь эту информацию.

Но в любом случае, чтобы отобразить словоформы на их леммы и синтезировать словоформы из лемм, взгляните на morpha и morphg, а также на Java-версию -конец) morphg содержится в пакете SimpleNLG . Существуют такие методы, как getInfinitive, getPastParticiple и т. Д. См., Например, API для класса Verb .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...