Spacy EntityRuler - невозможно сопоставить, если токен полностью указан в верхнем регистре - PullRequest
0 голосов
/ 30 января 2020

Я пытаюсь использовать сопоставление токена с помощью EntityRuler. В моем случае я ищу подходящие вещи из списка. В этом списке каждый символ в верхнем регистре. Например:

mylist = ['AAA','BBB','CCC']

Я хочу сопоставить их в do c, но только если они также соответствуют верхнему регистру. Например, если 'AAA' находится в do c, оно должно совпадать, но если есть 'aaa', оно не должно совпадать.

Я пытался (предполагая, p - это шаблон из списка):

{'label':'Name', 'pattern':[{'ORTH':p}]}

и

{'label':'Name', 'pattern':[{'ORTH':p, 'IS_UPPER':True}]}

Я также пытался использовать 'TEXT' вместо «ОРТ», но ни одна из этих работ - все они также соответствуют «ааа». Я пропускаю что-то, чтобы соответствовать, только если случай соответствует?

...