Question

Я знаю, что POS-теги помечают каждое слово в предложении соответствующей частью речи, но разве это не то, что парсер тоже делает? то есть разбить предложение на составные части? Я посмотрел это на inte rnet, но не смог найти удовлетворительного объяснения. Пожалуйста, очистите мои сомнения. Заранее спасибо

Oliver Mason · Answer 1 · 26 апреля 2020

Это две разные процедуры:

Маркировка POS: каждому токену присваивается метка, которая отражает его класс слов.
Синтаксический анализ: каждому предложению присваивается структура (часто дерево), которая отражает то, как его компоненты связаны друг с другом.

POS-тегирование занимает tokenised последовательность слов и возвращает список аннотированных токенов, где каждый токен имеет метку класса слова. Это часто устраняется неоднозначностью, глядя на контекст, окружающий токен.

Существует также chunking , который группирует токены в связанные группы (такие как фразы существительные). Куски - это неперекрывающиеся последовательности.

Синтаксический анализ обычно приводит к дереву разбора для предложения; часто может быть много возможных деревьев в случае неоднозначных предложений.

POS-теги обычно являются подготовительным этапом синтаксического анализа, так как синтаксический анализатор обычно работает с классами слов (хотя есть некоторые алгоритмы синтаксического анализа, которые работают с токенами напрямую, или смесь меток и жетонов).

В чем разница между разбором и тегами части речи?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

В чем разница между разбором и тегами части речи?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы