Проблема распознавания именованных объектов Spacy - PullRequest
1 голос
/ 28 мая 2019

Я пытаюсь пометить ORG из набора текста, который я анализирую через

. То, что у меня есть, выглядит следующим образом:

import spacy
import en_core_web_sm
nlp = en_core_web_sm.load()

file = open("C:\\sample.txt")

doc = nlp(file.read())
print([(X.text, X.label_) for X in doc.ents])

Теперь мой результат печатает все возможные теги.Я просто хочу, чтобы он печатал ORG.Любые предложения о том, как это сделать?

1 Ответ

2 голосов
/ 28 мая 2019

X.label_ содержит имя сущности, поэтому все, что вам нужно, это добавить условие для возврата только тех кортежей, где X.label_ равно ORG:

print([(X.text, X.label_) for X in doc.ents if X.label_ == "ORG"])
#                                           ^------------------^   
...