Если вы хотите сделать это, вам нужно нормализовать необработанный текст и запросы. Простой пример: если вы хотите иметь возможность поиска по типу значения SOUNDEX, вам потребуется SOUNDEX как для строки запроса, так и для исходных необработанных данных, которые вы запрашиваете. Вы не можете эффективно обрабатывать пространство запросов на лету, поэтому вместо этого вы нормализуете его при создании индекса.
Технически, вам нужно только нормализовать фактический индекс, а не данные, но, поскольку ваши данные, вероятно, соответствуют вашему индексу, то его нужно будет нормализовать.
Это тот же процесс, что и "определение" слов, удаление множественного числа и т. Д.