Токенизация именованных объектов в Spacy - PullRequest
0 голосов
/ 12 февраля 2019

может кто-нибудь помочь, пожалуйста.

Я пытаюсь токенизировать документ, используя Spacy, посредством которого именованные сущности токенизируются.Например:

'Нью-Йорк - это город в Соединенных Штатах Америки'

будет маркирован как:

['New York', 'is', 'a ',' city ',' in ',' the ',' United States of America ']

Любые советы о том, как это сделать, очень приветствуются.Посмотрел использование span.merge (), но безуспешно, но я новичок в кодировании, поэтому, вероятно, что-то пропустил.

Заранее спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...