Я хочу знать различную длину байта набора символов, предоставляемого JVM.Например, ASCII, набор символов не-acsii, китайские символы и т. Д.
Любая идея, спасибо:)
Вызовите Charset.availableCharsets().values();, переберите список и напечатайте некоторую предопределенную строку в ByteArrayOutputStream. Затем получите байты и посмотрите длину массива.
Charset.availableCharsets().values();
ASCII, CP * и ISO 8859- * равны 1 байту. UCS-2 составляет 2 байта. UTF-16 имеет размер 2 или 4 байта. UTF-32 и UCS-4 имеют размер 4 байта. Большинство других (UTF-8, GB2312, EUC-JP, ShiftJIS и т. Д.) Являются переменными.