Как сохранить теги пространственного рендеринга в dict - PullRequest
0 голосов
/ 19 июня 2020

https://spacy.io/usage/visualizers#ent

Я пытаюсь визуализировать сущности в предложении с помощью spaCy. По ссылке выше вы можете увидеть пример.

Теперь мой вопрос. Как я могу сохранить эти объекты в словаре?

Я хочу проанализировать 100 предложений и сохранить частоту этих сущностей, чтобы увидеть, какие термины являются наиболее распространенными.

например: dict = {"PERSON": 23, "ORG": 2, "LO C": 19}

Кто-нибудь может помочь?

1 Ответ

0 голосов
/ 06 августа 2020

Вы можете сохранить метки сущностей в частотном словаре.

import spacy

nlp = spacy.load("en_core_web_lg")
text = "Apple is looking at buying U.K. startup for $1 billion"
doc = nlp(text)
ent_labels = [e.label_ for e in doc.ents]
freq = dict()
for l in ent_labels:
    freq[l] = ent_labels.count(l)
print(freq)

Вывод:

{'ORG': 1, 'GPE': 1, 'MONEY': 1}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...