Как поддерживать несколько языковых буферов с UBreakIterator - PullRequest
0 голосов
/ 25 января 2012

Как я могу использовать UBreakIterator с буфером, имеющим другую локаль? например: 金魚 わ た し ワ タ シ കെട്ടിയാടപ്പെടുന്ന महाभारत महाभारत हिन्दुओं स्मृति स्मृति में में, имеет несколько строк локали. Как я могу использовать UBreakIterator, чтобы он разбил каждое слово, учитывая его локали

Я пробовал это с "ja_JP" в программе на C, и она работает как ожидается, но не с "en_US". Какой должна быть правильная локаль значение для ubrk_open, чтобы это работало для каждого языка?

Любая помощь приветствуется.

Спасибо, Манодж Маратеил

1 Ответ

0 голосов
/ 26 января 2012

Вы можете разбить строку на части по сценарию (uchar.h), а затем выполнить разрыв для каждого запуска сценария.

...