Я пытаюсь включить пользовательские объекты в шаблоны Matcher на основе правил. Моя идея состояла в том, чтобы использовать двоичные флаги, подобно тому, как они используются при включении регулярных выражений в шаблоны Matcher.
Я нашел этот фрагмент в выпуске github (https://github.com/explosion/spaCy/issues/1499):
# get ID for custom flag and add getter (in this case, it just returns length of token text)
IS_TEST = nlp.vocab.add_flag(lambda text: text in ['test', 'testing']) # needs to be binary!
pattern = [{'SHAPE': 'dd'}, {IS_TEST: True}]
Однако я не хочу предоставлять возможные совпадения в виде списка («тест», «тестирование»), а использую типы сущностей, которые были созданы в предыдущих конвейерных компонентах, например, entity_type = 'TEST'.
Как создать двоичный флаг на основе пользовательских объектов, которые были аннотированы в предыдущих конвейерных компонентах?
Я был бы рад любой поддержке!
С наилучшими пожеланиями