Создание корпуса для POS-тегов на языке племени - PullRequest
0 голосов
/ 19 февраля 2019

Я использую NLTK для извлечения существительных из текстовой строки, и у каждого из его слов уже есть POS-теги на языке (ibaloi), который позже будет использоваться при создании грамматики:

sentence = "this is a tribal language"
words = nltk.word_tokenize(sentence)
taggedWords = tagged_text = nltk.pos_tag(nltk.Text(words))

Существуетнет проблем на английском. Есть ли способ заставить его работать и на племенном (ибалои) языке?

(Я новичок в процессе естественного языка, взяв несколько уроков, что, кстати, замечательно).

1 Ответ

0 голосов
/ 20 февраля 2019

Возможно, вы захотите обратиться к этому подобному вопросу, где у ОП также был список слов, содержащий слово и часть речи (существительное, глагол и т. Д.) В файле Excel, для языка, не входящего в NLTK.

...