Для установок Windows и Linux в «западном мире» я знаю, что это значит.
Вероятно, не так хорошо, как вы думаете.
Но, думая о российских или азиатских платформах, я совершенно не уверен, какой кодировкой по умолчанию для их платформ является
Обычно это то, что исторически используется в их стране.
(только UTF-16?).
Определенно нет. Использование компьютера широко распространилось до появления стандарта Unicode, и каждая языковая область разработала одну или несколько кодировок, которые могли бы поддерживать его язык. Те, кому требовалось менее 128 символов вне ASCII, обычно разрабатывали «расширенный ASCII», многие из которых в конечном итоге были стандартизированы как ISO-8859 , тогда как другие разработали двухбайтовые кодировки, часто несколько конкурирующих. Например, в Японии для электронной почты обычно используется JIS , но для веб-страниц используется Shift-JIS , а в некоторых приложениях используется EUC-JP . Любой из них может рассматриваться как кодировка платформы по умолчанию в Java.
Это огромный беспорядок, именно поэтому был разработан Unicode. Но беспорядок еще не исчез, и нам все еще приходится иметь дело с ним, и мы не должны делать какие-либо предположения о том, в какую кодировку входит данная группа байтов, которые должны интерпретироваться как текст. Нет такого понятия, как обычный текст .