Что означает UnmappableCharacterException? - PullRequest
3 голосов
/ 26 июня 2009

CharsetDecoder читает:

Существует два основных типа ошибок декодирования. Если входная последовательность байтов недопустима для этой кодировки, то ввод считается искаженным . Если входная последовательность байтов является допустимой, но не может быть сопоставлена ​​с действительным символом Unicode, то обнаружен не отображаемый символ .

Я понимаю концепцию искаженных символов, но что означает не отображаемый персонаж? Я думал, что Юникод содержит все возможные символы. Как тогда допустимая последовательность байтов не может быть сопоставлена ​​с символом Unicode?

Ответы [ 2 ]

4 голосов
/ 26 июня 2009

Хотя Unicode может представлять большое количество символов для большого количества языков, он, конечно, не является исчерпывающим. Другими словами, существуют наборы символов с символами, для которых нет отображения в Unicode.

0 голосов
/ 26 июня 2009

Просто предположение ...

Я ожидаю, что такое значение будет существовать в одном из пустых блоков, которые еще не были заполнены для реализации. Ошибка, вероятно, предвосхищает значения, которые будут допустимыми символами в будущем, но не существуют в настоящее время. Набор символов, охватываемый Юникодом, является незавершенной работой, которая может никогда не завершиться (см. предлагаемые символы для символов, находящихся на рассмотрении в настоящее время).

...