Поиск Сфинкса: Недостающие акценты / диакритические знаки в результатах - PullRequest
0 голосов
/ 24 октября 2018

Я использую Sphinx search version 2.2.11.

Sphinx возвращает данные без акцентов / диакритических знаков, например.«cerny» вместо «černý».

Он вернет правильные элементы, даже если в самом запросе есть акценты / диакритические знаки, только кодировка результатов неверна.

Я знаю, что имелэта проблема раньше, но я не помню, как я решил, это было 3 года назад, я думаю, что это было на версии 2.1. Что-то тогда.

Может быть, это как-то плохо проиндексировано?

Релевантночасть моей конфигурации:

searchd {
        ...
        collation_server = utf8_general_ci
}

index xxx {
        source = xxxSrc
        path = /var/lib/sphinxsearch/xxx
        charset_table = 0..9, A..Z->a..z, _, a..z, U+0e1->a, U+0c1->a, U+10d->c, U+10c->c,
        U+10f->d, U+10e->d, U+0e9->e, U+0c9->e, U+11b->e, U+11a->e, U+0ed->i, U+0cd->i, U+148->n,
        U+147->n, U+0f3->o, U+0d3->o, U+159->r, U+158->r, U+161->s, U+160->s, U+165->t, U+164->t,
        U+0fa->u, U+0da->u, U+16f->u, U+16e->u, U+0fd->y, U+0dd->y, U+17e->z, U+17d->z,
        index_exact_words = 1
        docinfo = extern
        morphology = stem_cz
        min_stemming_len = 5
        min_infix_len = 3
}

Спасибо за любую помощь.

1 Ответ

0 голосов
/ 24 октября 2018

Хорошо, не на самом деле проблема сфинкса, но в ODBC / Oracle

это исправлено

export NLS_LANG="CZECH_CZECH REPUBLIC.AL32UTF8"
...