Общий вопрос преобразования набора символов между 2 различными наборами символов - PullRequest
0 голосов
/ 13 января 2020

Если у меня есть символ č, который записывается в / из файла в / из экрана с использованием ISO8859-13, символ отображается, как и ожидалось. При проверке связанной двоичной информации č сохраняется как 11101000, который в шестнадцатеричном формате равен E8 и соответствует кодовой странице 8859-13, показанной ниже.

enter image description here

Если этот же символ передается какому-то другому механизму и сохраняет данные, используя AL32UTF8, как это делается?

1 - передает ли он фактический символ č, и другой механизм должен найти его значение в кодовой странице AL32UTF8 на основе фактического символа?

2 - передает ли ему значение кодовой страницы E8, и другой механизм находит E8 в своей собственной кодовой странице, чтобы найти символ, который он представляет?

3 - Будет ли два механизма понимают, что требуется преобразование между двумя наборами символов, и находят значение Unicode, чтобы два набора символов могли иметь общее основание?

Если не один из вышеперечисленных 3, что является общим за процесс сцены при переходе от одного набора символов к другому?

...