Я использовал Метафон и soundex Кодер с "Phoneti c Token Filter" в Elasticsearch.
Метафон хорош для Английский sh слов.
Soundex подходит для Engli sh, а также хинди может быть много других языков .
Я хочу знать, какой из этих кодировщиков лучше всего оптимизирован для хинди и, если возможно, для других индийских языков?
- Soundex
- Метафон
- double_metaphone
- refined_soundex
- caverphone1 - Engli sh (локализован в Новой Зеландии)
- caverphone2 - Engli sh (локализован в Новой Зеландии)
- кёльн - немецкий
- nysiis - импровизированный Soundex
- koelnerphonetik - немецкий
- haasephonetik - немецкий
- beider_morse - Engli sh и несколько европейских языков
- daitch_mokotoff - Slavi c & Yiddi sh Фамилия
As Это не указано на сайте Elasticsearch , для какого языка мы должны выбрать, какой кодировщик.
Также скажите, какой из кодировщиков вы уже использовали и для какого языка.