UAX # 14 с libunibreak и одной строкой текста на нескольких языках - PullRequest
1 голос
/ 06 июля 2019

Рассмотрим одну строку текста со словами в нескольких языках.Это требует запуска алгоритма разрыва строки для каждого диапазона текста отдельно, поскольку функция разрыва строки принимает языковой параметр.

Но тогда алгоритм ставит жесткий конец в конце каждого фрагмента текста.

Это ограничение UAX # 14 или libunibreak?И есть ли обходной путь?

Спасибо!

1 Ответ

1 голос
/ 08 июля 2019

ограничение UAX # 14 или libunibreak

libunibreak.Чтобы убедиться, что это правда, просто посмотрите на другую реализацию , которая предлагает более детальный API, чем просто "язык".Это не обходной путь, а альтернатива;для вашего C-проекта вы должны иметь возможность включить базовый сомбок вместо libunibreak.

...