tokens = [The, wage, productivity, nexus, the, process, of, development,....]
Я пытаюсь преобразовать список токенов в их лемматизированную форму с помощью лемматизатора SpaCy. Здесь - документация, которую я использую.
Мой код:
from spacy.lemmatizer import Lemmatizer
from spacy.lookups import Lookups
lookups = Lookups()
lookups.add_table("lemma_rules")
lemmatizer = Lemmatizer(lookups)
lemmas = []
for tokens in filtered_tokens:
lemmas.append(lemmatizer(tokens))
сообщение об ошибке
TypeError Traceback (most recent call last)
in
7 lemmas = []
8 for tokens in filtered_tokens:
----> 9 lemmas.append(lemmatizer(tokens))
TypeError: __call__() missing 1 required positional argument: 'univ_pos'
Я понял это обсуждение того, как работает Лемматизатор SpaCy, и его теоретическое понимание. Однако я не уверен, как мне это реализовать.
Как я могу узнать univ_pos
для моих токенов?