Это две разные процедуры:
Маркировка POS: каждому токену присваивается метка, которая отражает его класс слов.
Синтаксический анализ: каждому предложению присваивается структура (часто дерево), которая отражает то, как его компоненты связаны друг с другом.
POS-тегирование занимает tokenised последовательность слов и возвращает список аннотированных токенов, где каждый токен имеет метку класса слова. Это часто устраняется неоднозначностью, глядя на контекст, окружающий токен.
Существует также chunking , который группирует токены в связанные группы (такие как фразы существительные). Куски - это неперекрывающиеся последовательности.
Синтаксический анализ обычно приводит к дереву разбора для предложения; часто может быть много возможных деревьев в случае неоднозначных предложений.
POS-теги обычно являются подготовительным этапом синтаксического анализа, так как синтаксический анализатор обычно работает с классами слов (хотя есть некоторые алгоритмы синтаксического анализа, которые работают с токенами напрямую, или смесь меток и жетонов).