Голландская грамматика в питонском NLTK - PullRequest
5 голосов
/ 14 февраля 2011

Я работаю над голландским корпусом и хочу знать, есть ли в NLTK голландская грамматика, чтобы я мог разобрать свои предложения?Вообще НЛТК работает только на английском?Я знаю, что у него есть голландская копора Alpino, но нет никаких указаний на то, что функции (например, разбор с использованием CFG) также предназначены для голландского языка.Спасибо

Ответы [ 2 ]

2 голосов
/ 07 марта 2011

Это ответ на мое письмо от Стивена Берда, одного из авторов книги NLTK:

NLTK может работать для разбора голландского, если вы предоставите правила грамматики. Пожалуйста, обратитесь к книге NLTK для руководства: http://www.nltk.org/book Возможно, вы сможете использовать корпус Alpino для разработки грамматика (или тренировка статистического парсера). Если ваш основной интерес получает разобранные предложения голландского, я рекомендую вам попробовать найти существующий парсер, а не разрабатывать свой собственный.

В итоге я использовал парсер Alpino, который действительно сильный и написан на Прологе, но мне удалось портировать (двоичную версию) на python.

0 голосов
/ 06 марта 2011

У меня нет прямого ответа, но, комбинируя информацию, поступающую с двух следующих страниц, вы сможете найти ее. Здесь вы можете найти обзор интерфейса синтаксического анализа высокого уровня в NLTK.Для синтаксических анализаторов требуется модель, которая при наличии будет указана на странице для документации пакетов , которые поставляются с nltk .

Как вы уже знаете, Alpino Dutch Treebank поставляется вместес NLTK, так что в худшем случае вы сможете самостоятельно изучить модель (API синтаксического анализатора также предоставляет средства обучения).

Надеюсь, это поможет.

...