Какова длина байта для другого набора символов в Java? - PullRequest
1 голос
/ 07 декабря 2010

Я хочу знать различную длину байта набора символов, предоставляемого JVM.Например, ASCII, набор символов не-acsii, китайские символы и т. Д.

Любая идея, спасибо:)

Ответы [ 2 ]

1 голос
/ 07 декабря 2010

Вызовите Charset.availableCharsets().values();, переберите список и напечатайте некоторую предопределенную строку в ByteArrayOutputStream. Затем получите байты и посмотрите длину массива.

0 голосов
/ 07 декабря 2010

ASCII, CP * и ISO 8859- * равны 1 байту. UCS-2 составляет 2 байта. UTF-16 имеет размер 2 или 4 байта. UTF-32 и UCS-4 имеют размер 4 байта. Большинство других (UTF-8, GB2312, EUC-JP, ShiftJIS и т. Д.) Являются переменными.

...