Могу ли я использовать Spacy для классификации существительных? - PullRequest
0 голосов
/ 06 января 2020

Люди используют Spacy для обнаружения именованных сущностей (имен собственных) в куске текста. Мне интересно, можно ли использовать Spacy для обнаружения и классификации существительных вместо правильных существительных. Если мы тренируемся с набором данных существительных, будет ли работать тот же алгоритм?

1 Ответ

1 голос
/ 06 января 2020

Да. С каждым токеном связан тег части речи (pos). К POS для каждого токена можно получить доступ с помощью атрибута token.pos_.

import spacy

nlp = spacy.load("en_core_web_sm")
doc = nlp("My name is Chaithanya. I have a book, a pen, an eraser and a pencil on me. ")

for token in doc:
  if token.pos_ == "NOUN":
    print(token.text, token.pos_)

Выход :

name NOUN
book NOUN
pen NOUN
eraser NOUN
pencil NOUN
...