Мне не нужны специальные символы, когда я индексирую слова строки. Я понимаю, что StandardAnalyzer удаляет специальные символы, но также не индексирует стоп-слова и отдельные символы, и я хочу индексировать стоп-слова и отдельные символы.
Например: список сайтов организации отелей (hmo) Проиндексированные слова: список отелей, менеджмент, организация, hmo, site
Есть ли фильтр для этого? Как я могу построить собственный Анализатор для этой цели? Может быть, фильтр, который заменяет не-алфавитные символы c на ""?