Я ищу что-то вроде функциональности поиска и замены в Solr.
Я выгрузил документ в solr и анализирую текст поверх него.Иногда мне может понадобиться сгруппировать пару слов вместе и попросить solr рассматривать его как один токен.
Например: «Южная Африка» будет рассматриваться как один токен для дальнейшей обработки.А также обратите внимание, что они могут быть динамичными, и я собираюсь позволить конечному пользователю решить, какие слова он / она должен сгруппировать.Так что семантика не требуется.
Мой текущий план - добавить специальный символ между этими двумя словами, чтобы Solr рассматривал его как один единственный токен (StandardTokenizerFactory) для дальнейшей обработки.
Так что я ищучто-то вроде:
replace("South Africa",South_Africa")
Может у кого-нибудь есть решение?