Я использую Spacy NLP. Ни один синтаксический анализатор не всегда может правильно определить статус PROPN / NOUN / VERB неоднозначного токена, поскольку в большинстве языков слово, написанное одинаково, может иметь разные значения.
Например, «Encounter» может быть Encounter в терминахинопланетяне сажают вас в свой космический корабль (Существительное, вхождение) или «Встреча», как «Встреча с миром» -> вступают в контакт с (Глагол).
Spacy иногда идентифицирует одно и то же написанное слово по-разномудаже в подобных ситуациях:
Это пунктуация ("="?), которая вызывает это?
Я ожидал непрерывной идентификации токенакак глагол или существительное, но не для изменения. Я понимаю, что использование обученных пространственных данных (с использованием en_small и en_medium) не использует LSTM по мере продвижения, поэтому я не должен ожидать, что spacy "установит преемственность из-за предыдущего решения в том же предложении", но я все еще удивлен, учитывая то же предложениеформат, а также идентичный контент, spacy определяет по-разному ..
Встреча с миром. Встреча с собой "и" Встреча с миром = Встреча с самим собой => разбирает VERB, NOUN соответственно
"Встреча с самим собой. Встреча с миром. "
=> парсит VERB, VERB.
" Encounter the self "
=> парсит VERB