Использование Spacy Visualizer с пользовательскими данными - PullRequest
0 голосов
/ 28 апреля 2019

Я хочу визуализировать предложение, используя именованный визуализатор объектов Spacy. У меня есть предложение с некоторыми пользовательскими метками над токенами, и я хочу визуализировать их с помощью API рендеринга NER.

Я не хочу обучать и создавать прогностическую модель, у меня есть все необходимые ярлыки из внешнего источника, просто нужна визуализация, не слишком мешающая с интерфейсными библиотеками.

Есть идеи как?
Спасибо

1 Ответ

0 голосов
/ 28 апреля 2019

Вы можете вручную изменить список объектов (doc.ents) и добавить новые диапазоны, используя смещения токенов.Помните, что сущности не могут перекрываться вообще.

import spacy
from spacy.tokens import Span
nlp = spacy.load('en', disable=['ner'])
doc = nlp("I see an XYZ.")
doc.ents = list(doc.ents) + [Span(doc, 3, 4, "NEWENTITYTYPE")]
print(doc.ents[0], doc.ents[0].label_)

Вывод:

XYZ NEWENTITYTYPE
...