Первые шаги в создании моего собственного CFG на основе токенизированных предложений из Корпуса? (Голландский) - PullRequest
0 голосов
/ 03 мая 2020

Я довольно новичок в NLTK и зашел довольно далеко. Тем не менее, я, кажется, застрял. Я должен разработать грамматику, которая сможет разобрать предложения моего корпуса. Я пометил предложения предложениями, пометил часть речи с помощью голландского теггера и исправил ошибки внутри.

Я не могу понять, как начать это делать. Должен ли я сам разбирать деревья по предложениям, а затем сравнивать их все и объединять в одно? Всего у меня 104 предложения.

Есть ли определенный способ сделать это? Я все еще новичок в этом, и книга NLTK довольно запутанная. Я надеюсь, что разъяснил свой вопрос, но если нет, пожалуйста, дайте мне знать.

Спасибо!

...