Как реализовать нечеткий поиск китайского пиньинь и японского ромадзи? - PullRequest
0 голосов
/ 09 апреля 2019

У меня есть некоторые данные на китайском и японском языках, и я хочу, чтобы их можно было искать по их латинизации (пиньинь для китайского, ромаджи для японского).Предположим, что романизации уже предусмотрены, разделены слогами.

например.текст "示例文本", который переводится в ["shi", "li", "wen", "ben"].

. Пользователи должны иметь возможность сопоставить это, набрав

  • целых слогов, с пробелом или без, например.shi li wen ben или shiliwenben
  • инициалы или первые несколько букв слогов, например.shlwb или slwb
  • они также могут вводить только часть строки, например.wenben или wb (эти примеры соответствуют двум последним слогам текста выше).

Существует ли элегантный способ реализации этого?

(примечание: Iв этом вопросе не указан какой-либо язык программирования, потому что я хочу реализовать его на разных языках. Если ваш ответ зависит от конкретного языка или требует специальных библиотек, уточните это. Спасибо!)

...