Обучение классификатору NER не зависит от языка.Вы должны предоставлять высококачественные данные обучения и создавать значимые функции.Дело в том, что не все функции одинаково полезны для всех языков.Например, использование заглавных букв является хорошим показателем для названной компании на английском языке.Но в немецком языке все существительные пишутся с большой буквы, что делает эти функции менее полезными.
В Stanford NER вы можете решить, какие функции должен использовать классификатор, и, следовательно, вы можете отключить POS-теги (фактически они отключены по умолчанию).Конечно, вы также можете предоставить свои собственные POS-теги на желаемом языке.
Я надеюсь, что смогу уточнить некоторые вещи.