Question

В Java у меня есть String, и я хочу закодировать его как байтовый массив (в UTF8 или в другой кодировке). Кроме того, у меня есть байтовый массив (в некоторой известной кодировке), и я хочу преобразовать его в строку Java. Как мне сделать эти преобразования?

mcherm · Answer 1 · 18 сентября 2008

Преобразовать из строки в байт []:

String s = "some text here";
byte[] b = s.getBytes(StandardCharsets.UTF_8);

Преобразовать из байта [] в строку:

byte[] b = {(byte) 99, (byte)97, (byte)116};
String s = new String(b, StandardCharsets.US_ASCII);

Вы, конечно, должны использовать правильное имя кодировки. В моих примерах использовались US-ASCII и UTF-8, две наиболее распространенные кодировки.

M. Leonhard · Answer 2 · 02 августа 2010

Вот решение, которое позволяет не выполнять поиск Charset для каждого преобразования:

import java.nio.charset.Charset;

private final Charset UTF8_CHARSET = Charset.forName("UTF-8");

String decodeUTF8(byte[] bytes) {
    return new String(bytes, UTF8_CHARSET);
}

byte[] encodeUTF8(String string) {
    return string.getBytes(UTF8_CHARSET);
}

McDowell · Answer 3 · 18 сентября 2008

Вы можете конвертировать напрямую с помощью конструктора String (byte [], String) и getBytes (String). Java предоставляет доступные наборы символов через класс Charset . В документации JDK перечислены поддерживаемые кодировки .

90% времени такие преобразования выполняются в потоках, поэтому вы должны использовать классы Reader / Writer . Вы не будете постепенно декодировать, используя методы String в произвольных байтовых потоках - вы оставите себя открытыми для ошибок, связанных с многобайтовыми символами.

paiego · Answer 4 · 20 октября 2013

Моя реализация tomcat7 принимает строки как ISO-8859-1; несмотря на тип содержимого HTTP-запроса. Следующее решение помогло мне при попытке правильно интерпретировать символы, такие как «é».

byte[] b1 = szP1.getBytes("ISO-8859-1");
System.out.println(b1.toString());

String szUT8 = new String(b1, "UTF-8");
System.out.println(szUT8);

При попытке интерпретировать строку как US-ASCII, информация байта не была правильно интерпретирована.

b1 = szP1.getBytes("US-ASCII");
System.out.println(b1.toString());

vtor · Answer 5 · 11 мая 2015

В качестве альтернативы можно использовать StringUtils от Apache Commons.

 byte[] bytes = {(byte) 1};
 String convertedString = StringUtils.newStringUtf8(bytes);

или

 String myString = "example";
 byte[] convertedBytes = StringUtils.getBytesUtf8(myString);

Если у вас нестандартная кодировка, вы можете использовать getBytesUnchecked () или newString () соответственно.

Bouke Woudstra · Answer 6 · 01 июля 2016

Для декодирования серии байтов в обычное строковое сообщение я наконец-то получил его для работы с кодировкой UTF-8 с этим кодом:

/* Convert a list of UTF-8 numbers to a normal String
 * Usefull for decoding a jms message that is delivered as a sequence of bytes instead of plain text
 */
public String convertUtf8NumbersToString(String[] numbers){
    int length = numbers.length;
    byte[] data = new byte[length];

    for(int i = 0; i< length; i++){
        data[i] = Byte.parseByte(numbers[i]);
    }
    return new String(data, Charset.forName("UTF-8"));
}

Pacerier · Answer 7 · 15 июля 2012

Если вы используете 7-битный ASCII или ISO-8859-1 (удивительно распространенный формат), тогда вам вообще не нужно создавать новую java.lang.String . Гораздо эффективнее просто преобразовать байт в символ:

Полный рабочий пример:

for (byte b : new byte[] { 43, 45, (byte) 215, (byte) 247 }) {
    char c = (char) b;
    System.out.print(c);
}

Если вы не , используя расширенные символы , такие как Ä, Æ, Å, Ç, Ï, Ê и , можете быть уверены, что только переданные значения из первых 128 символов Unicode, тогда этот код также будет работать для UTF-8 и расширенного ASCII (например, cp-1252).

Nitish Raj · Answer 8 · 15 января 2016

Charset UTF8_CHARSET = Charset.forName("UTF-8");
String strISO = "{\"name\":\"א\"}";
System.out.println(strISO);
byte[] b = strISO.getBytes();
for (byte c: b) {
    System.out.print("[" + c + "]");
}
String str = new String(b, UTF8_CHARSET);
System.out.println(str);

jschober · Answer 9 · 12 мая 2015

Я не могу комментировать, но не хочу начинать новую тему. Но это не работает. Простое путешествие в оба конца:

byte[] b = new byte[]{ 0, 0, 0, -127 };  // 0x00000081
String s = new String(b,StandardCharsets.UTF_8); // UTF8 = 0x0000, 0x0000,  0x0000, 0xfffd
b = s.getBytes(StandardCharsets.UTF_8); // [0, 0, 0, -17, -65, -67] 0x000000efbfbd != 0x00000081

Мне нужен b [] один и тот же массив до и после кодирования, которого нет (это относится к первому ответу).

Как преобразовать строки в и из байтовых массивов UTF8 в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 13 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как преобразовать строки в и из байтовых массивов UTF8 в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 13 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов