Это интересный вариант использования, но токенизатор IMHO не является правильным местом, где это должно быть сделано, в основном процесс анализа elasticsearch состоит из следующих трех этапов.
- фильтр символов
- токенизатор
- фильтр токенов
если вы хотите изменить некоторые символы, перед отправкой их в токенизатор сделайте это в фильтре символов или измените токены в фильтр токенов, как вы можете видеть на этих этапах, вы можете выполнить больше преобразований, чем на этапе токенизатора.