Я использую ElasticSearch 5.6, и мои данные часто содержат числовые строки, содержащие порядковые или кардинальные числа как «пятый», «сорок один» или «сто двадцать два».Я хочу, чтобы анализатор, чей токен-фильтр превратил эти числовые формы слов в более простую числовую форму, например,
"fifth" ==> 5
"forty-one" ==> 41
"one hundred and twenty two" ==> 122
Делать это через синонимы было бы очень громоздко, и я не могу сделать это правильно, используя Patternзаменить.Как во время ввода, так и в процессе поиска, данные могут содержать все формы числовых слов, например 5 / 5th / Five / Fifth.
Любая помощь здесь будет оценена!