Существуют ли опубликованные генеративные грамматики для естественных языков? - PullRequest
11 голосов
/ 05 июля 2011

У меня есть идеи по поводу обработки естественного языка. Мне понадобятся грамматики

S -> NP VP

разнообразие, чтобы играть с ними.

Если я попытаюсь написать эти правила самостоятельно, это будет утомительным и подверженным ошибкам делом. Кто-нибудь когда-либо печатал и выпускал исчерпывающие наборы правил для английского и других естественных языков? Идеально написано в BNF, Prolog или аналогичном синтаксисе.

Мой проект относится только к контекстно-свободным грамматикам, меня не интересуют статистические методы или машинное обучение - мне нужно систематически создавать предложения, похожие на англицкие и фобарианские.

Если вы знаете, где найти такую ​​технику, я был бы очень признателен.

Ответы [ 3 ]

5 голосов
/ 06 июля 2011

Возможно, вы захотите взглянуть на Attempto Controlled English и его инструменты на основе Пролога.

Поскольку статистический анализ вошел в моду в начале 90-х годов, грамматики обычно не распространялись, за исключениемдля конкретных проблемных доменов, но полученных из распределенных корпусов, таких как Penn Treebank.Если вы можете овладеть этим (я полагаю, что образец распространяется с NLTK), вы можете «свернуть свою» грамматику, просматривая все фрагменты дерева и переводя их в правила.(Например, если вы найдете узел с меткой S с дочерними элементами с метками NP и VP , вы знаете, что должно быть правило S -> NP VP . Было бы неплохо обрезать правила, которые встречаются редко.)

3 голосов
/ 06 июля 2011

Наиболее полная контекстно-свободная грамматика для английского языка, которую я знаю, описана в:

Gazdar, Gerald;Эван Х. Клейн, Джеффри К. Пуллум, Иван А. Саг.1985. Обобщенная грамматика структуры фраз. Oxford: Blackwell.

Есть также несколько свободно распространяемых грамматик на основе правил, но не зависящих от контекста, например, грамматика Penn XTAG или HPSG Английская грамматика ресурсов .

1 голос
/ 30 июля 2011

Посмотрите на Грамматические рамки . Это функциональный язык программирования для многоязычных грамматических приложений, который поставляется с библиотеками для ~ 30 языков, включая английский.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...