Как мне относиться к категоризации предложений по времени (настоящее, прошлое, будущее и т. Д.)? - PullRequest
2 голосов
/ 04 февраля 2011

Я хочу разобрать текст и классифицировать предложения в соответствии с их грамматической структурой, но у меня очень слабое понимание НЛП, поэтому я даже не знаю, с чего начать.

Насколько я прочитал, мне нужно проанализировать текст и выяснить (или пометить?) Часть речи каждого слова. Затем я ищу фразу глагола или любую другую определяющую характеристику, которую хочу использовать для категоризации предложений.

Чего я не знаю, так это того, что уже есть какой-то способ сделать это проще или мне нужно отдельно определить правила грамматики или что.

Любые ресурсы по НЛП, которые обсуждают это, были бы великолепны. Примеры программ также приветствуются. Я использовал NLTK раньше, но не широко. Другие парсеры или языки тоже в порядке!

Ответы [ 2 ]

3 голосов
/ 04 февраля 2011

Python Natural Language Toolkit - это библиотека, которая подходит для такой работы. Как и в случае любой библиотеки НЛП, вам придется отдельно загружать набор данных для обучения, а также корпус (данные) и сценарии для обучения.

Существуют также примеры учебных пособий , которые помогут вам определить части речи для слов. В любом случае, я думаю, что nltk.org должен быть тем местом, где можно найти то, что вы ищете.

Конкретные вопросы могут быть размещены здесь снова.

0 голосов
/ 04 февраля 2011

Может быть, вам просто нужно определить шаблоны, такие как "существительное глагол существительное" и т. Д. Для каждого типа грамматической структуры и поиска совпадений в выходной последовательности тегера части речи.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...