Я довольно новичок в NLTK и зашел довольно далеко. Тем не менее, я, кажется, застрял. Я должен разработать грамматику, которая сможет разобрать предложения моего корпуса. Я пометил предложения предложениями, пометил часть речи с помощью голландского теггера и исправил ошибки внутри.
Я не могу понять, как начать это делать. Должен ли я сам разбирать деревья по предложениям, а затем сравнивать их все и объединять в одно? Всего у меня 104 предложения.
Есть ли определенный способ сделать это? Я все еще новичок в этом, и книга NLTK довольно запутанная. Я надеюсь, что разъяснил свой вопрос, но если нет, пожалуйста, дайте мне знать.
Спасибо!