Замена локальных символов? - PullRequest
1 голос
/ 15 января 2012

Есть ли способ заменить любые иностранные символы, например: ã, ä на a, Ĉ, ć на c и т. Д. Я имею в виду оставлять простые буквы, такие как a-Z, без каких-либо дополнительных вещей.

1 Ответ

3 голосов
/ 15 января 2012

Вы можете сделать это регулярное выражение, если вам доступны регулярные выражения:

str = str.replaceAll("[^a-zA-Z]", ""); //Assuming it to be a Java String

Однако, если вы хотите нормализовать свой текст, вам следует поступить так, как предлагает принятый ответ на этот вопрос: Удалите диакритические знаки (ñ ň ǹ ñ ň ņ ṋ ṋ ṉ ̈ ɲ ᶇ ɳ ȵ) из символов Unicode

Если вам нужно добиться того же самого в PHP, вы можете написать:

echo iconv('UTF-8', 'US-ASCII//TRANSLIT', 'asdaśćż,ąółwe,ÄĄ;ú');
...