В чем разница между разбором и тегами части речи? - PullRequest
1 голос
/ 26 апреля 2020

Я знаю, что POS-теги помечают каждое слово в предложении соответствующей частью речи, но разве это не то, что парсер тоже делает? то есть разбить предложение на составные части? Я посмотрел это на inte rnet, но не смог найти удовлетворительного объяснения. Пожалуйста, очистите мои сомнения. Заранее спасибо

1 Ответ

0 голосов
/ 26 апреля 2020

Это две разные процедуры:

  • Маркировка POS: каждому токену присваивается метка, которая отражает его класс слов.

  • Синтаксический анализ: каждому предложению присваивается структура (часто дерево), которая отражает то, как его компоненты связаны друг с другом.

POS-тегирование занимает tokenised последовательность слов и возвращает список аннотированных токенов, где каждый токен имеет метку класса слова. Это часто устраняется неоднозначностью, глядя на контекст, окружающий токен.

Существует также chunking , который группирует токены в связанные группы (такие как фразы существительные). Куски - это неперекрывающиеся последовательности.

Синтаксический анализ обычно приводит к дереву разбора для предложения; часто может быть много возможных деревьев в случае неоднозначных предложений.

POS-теги обычно являются подготовительным этапом синтаксического анализа, так как синтаксический анализатор обычно работает с классами слов (хотя есть некоторые алгоритмы синтаксического анализа, которые работают с токенами напрямую, или смесь меток и жетонов).

...