Как использовать простейший лемматизатор с другой позиционированием - PullRequest
0 голосов
/ 02 января 2019

Я работаю над задачами маркировки POS с помощью различных библиотек (включая шаблоны), а также задач лемматизации.

Каждый раз, когда я использую пространственную лемматизацию, она автоматически генерирует тег spacy pos для каждого слова в предложении.

Тем не менее, я хотел бы использовать тег pos, сгенерированный шаблоном (а не из spacy), чтобы улучшить лемматизацию предложения.

Возможно ли это?

1 Ответ

0 голосов
/ 03 января 2019

Я сейчас тоже занимаюсь этой проблемой.Вот некоторые вещи, которые я узнал, надеюсь, что это укажет вам правильное направление.

Tagger является частью конвейера spaCy.

Похоже, что вам нужно сделать:

  • отключить Spacy POS tagger, а также создать и подключить свой собственный (информация здесь: https://spacy.io/usage/processing-pipelines)
  • создайте свой собственный элемент канала lemmatizer, который будет вызывать nlp.vocab.morphology.lemmatizer с тегами, назначенными тэгером. Или, может быть, это лучшее решениеМожно создать собственный экземпляр лемматизатора, вызвав nlp.Defaults.create_lemmatizer, а затем использовать его.

Надеюсь, это поможет.

...