Отображать арабские / персидские буквы / символы отдельно в Java? - PullRequest
4 голосов
/ 11 июля 2020

Я хочу правильно разделить каждую букву / символ арабского / персидского слова изолированной буквой / символом, не меняя его лица, и сохранить их среднюю / начальную / изолированную / конечную форму,

Вот пример:

Обычная сегментация:

بابا ====>  ب ا ب ا

شاهین ====> ش ا ه ی ن

Желаемая сегментация:

بابا ====> بـ ـابـ ـا

شاهین ====> شـ ـاهـ یـ ـن

1 Ответ

1 голос
/ 11 июля 2020

Для этого вы можете использовать нормализатор. Посмотрите здесь для получения дополнительной информации.

Примерно:

 String segmented = Normalizer.normalize(input, Form.NFKD).replaceAll("\\p{M}", "");
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...