Последние несколько дней я изучал soundex, metaphone и другие методы поиска строк, и в моем понимании оба алгоритма хорошо работают при обработке неанглоязычных слов, транслитерированных на английский язык.
Однако у меня должно быть требование, чтобы такой поиск работал на оригинальных, нетранслитных языках, включая алфавиты, такие как немецкий, норвежский и даже кириллический.
Существуют ли алгоритмы поиска, способные полностью обработать эти алфавиты? Или мне лучше использовать сторонние библиотеки полнотекстового поиска, такие как Lucene? Следовательно, возникает вопрос: «Обрабатывает ли Lucene неанглийские алфавиты?»