NLTK использует свой собственный тег для обозначения части речи.
Но точность будет варьироваться от текста к тексту. Это потому, что теггер был обучен с использованием корпуса, предоставленного самим NLTK. Корпус может быть о чем угодно.
Корпус не похож на ваш текст, тогда тегер не сможет пометить ваш текст, потому что контекст, стиль очень разные.
Вы можете обучить свой собственный tagger, если у вас есть время, чтобы сделать это.
Компьютер не человек, компьютер просто делает то, что мы им сказали. Поэтому, чтобы заставить его делать это правильно, вы должны научить их правильно достигать наилучшего результата.