Используйте пользовательские объекты в шаблоне SpaCy Matcher с бинарными флагами - PullRequest
0 голосов
/ 18 января 2019

Я пытаюсь включить пользовательские объекты в шаблоны Matcher на основе правил. Моя идея состояла в том, чтобы использовать двоичные флаги, подобно тому, как они используются при включении регулярных выражений в шаблоны Matcher.

Я нашел этот фрагмент в выпуске github (https://github.com/explosion/spaCy/issues/1499):

# get ID for custom flag and add getter (in this case, it just returns length of token text)
IS_TEST = nlp.vocab.add_flag(lambda text: text in ['test', 'testing']) # needs to be binary!
pattern = [{'SHAPE': 'dd'}, {IS_TEST: True}]

Однако я не хочу предоставлять возможные совпадения в виде списка («тест», «тестирование»), а использую типы сущностей, которые были созданы в предыдущих конвейерных компонентах, например, entity_type = 'TEST'.

Как создать двоичный флаг на основе пользовательских объектов, которые были аннотированы в предыдущих конвейерных компонентах?

Я был бы рад любой поддержке!

С наилучшими пожеланиями

...