Я новичок в NLP и Python и пытаюсь создать POS-тег для своего языка в качестве отдельного проекта, но я не понимаю, как начать.
Теперь у меня есть малайский набор тегов со списками из 13 оригинальных частей речи, малайский корпус и библиотека NLTK для малайского языка.
У меня есть инструменты, но я просто не знаю, с чего начать.
Я пытался следовать учебнику по anaconda pos tagger, заменяя коричневый корпус на малайский, но он не запускался. Я знаю, что я должен изменить некоторые вещи в коде, но я запутался, что изменить.