Я экспериментировал с аннотатором NER из Stanford regex и TokensRegex. Это прекрасно работает, мне просто интересно, можно ли сопоставлять регулярные выражения по леммам вместо слов?
Например, я создаю стандартный tsv-файл регулярных выражений:
plane TRANSPORT
car TRANSPORT
...
Могу ли я создать правило TokensRegex с помощью этой логики: if current token has lemma which has a match in TRANSPORT class, mark it as TRANSPORT
.
Цель также пометить planes
, cars
и т. Д. Как ТРАНСПОРТ без необходимости указывать все эти вариации в файле tsv.