Преобразование строки Java в ascii - PullRequest
20 голосов
/ 14 сентября 2010

Мне нужно преобразовать String s, состоящий из некоторых букв, определенных для определенных языков (например, HÄSTDJUR - note Ä), в String без этих специальных букв (в данном случае HASTDJUR). Как я могу сделать это на Java? Спасибо за помощь!


Это не совсем о том, как это звучит. Сценарий следующий - вы хотите использовать приложение, но у вас нет шведской клавиатуры. Поэтому вместо того, чтобы смотреть на карту символов, вы набираете ее, заменяя специальные буквы типичными буквами из латинского алфавита.

Ответы [ 2 ]

49 голосов
/ 14 сентября 2010

Я думаю, что ваш вопрос такой же, как этот:

Java - избавление от акцентов и преобразование их в обычные буквы

и, следовательно, ответ также тот же:

Решение

String convertedString = 
       Normalizer
           .normalize(input, Normalizer.Form.NFD)
           .replaceAll("[^\\p{ASCII}]", "");

Ссылки

См

Пример кода:

final String input = "Tĥïŝ ĩš â fůňķŷ Šťŕĭńġ";
System.out.println(
    Normalizer
        .normalize(input, Normalizer.Form.NFD)
        .replaceAll("[^\\p{ASCII}]", "")
);

Выход:

Это классная строка

2 голосов
/ 14 сентября 2010

Я бы предложил сопоставление специальных символов с теми, которые вам нужны.

Ä --> A
é --> e
A --> A (exactly the same)
etc...

И тогда вы можете просто вызвать ваше отображение поверх вашего текста (в псевдокоде):

for letter in string:
   newString += map(letter)

По сути, вам нужно создать набор правил для того, какие символы отображаются в эквиваленте ASCII.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...