Лучше сказать Кодировка символов вместо Кодовая страница
Кодировка символов - это способ привязать некоторый символ к некоторым данным (а также наоборот!)
Как говорит Википедия:
Система кодирования символов состоит из кода, который связывает каждый символ из данного репертуара с чем-то другим, например последовательностью натуральных чисел, октетами или электрическими импульсами, для облегчения передачи данных (обычно чисел и / или текст) через телекоммуникационные сети или хранилище текста в компьютерах
Наиболее популярными кодировками символов являются ASCII , UTF-16 и UTF-8
ASCII
Первая кодовая страница, которая широко используется в компьютерах. в ANSI для каждого символа выделяется только один байт. Таким образом, ANSI может иметь очень ограниченный набор символов (английские буквы, цифры, ...)
Как я уже сказал, ASCII использовался в старых операционных системах, таких как MS-DOS. Но ASCII не умер и все еще используется. Если у вас есть текстовый файл с 10 символами, а это 10 байтов, у вас есть файл ASCII!
UTF-16
В UTF-16 выделяется два байта символа. Таким образом, мы можем иметь 65536 различных символов в UTF-16!
Microsoft Windows использует UTF-16 для внутреннего использования.
UTF-8
UTF-8 - еще один популярный способ кодирования символов. он использует байты переменной длины (от 1 байта до 4 байтов) для символов. Он также совместим с ASCII, поскольку для символов ASCII используется 1 байт.
Большинство систем на базе Unix использует UTF-8
Языки программирования не зависят от кодовых страниц. Возможно, конкретная реализация языка программирования не поддерживает кодовые страницы (например, Turbo C ++)
Вы можете использовать любую кодовую страницу в современных языках программирования. У них также есть некоторые инструменты для преобразования кодовых страниц.
Существуют разные версии Unicode, такие как Utf-7, Utf-8, ... Вы можете прочитать о них здесь (рекомендуется!) И, возможно, для более формальных деталей здесь