PC-DOS против MS-DOS против многоязычных текстовых файлов Windows - PullRequest
0 голосов
/ 29 апреля 2019

Насколько мне известно, в 1987 году были выпущены PC-DOS 3.3, а также MS-DOS 3.3, и они имели несколько кодовых страниц (850, 860, 863, 865).

Означает ли этоэтот пользователь мог бы писать текст с использованием португальского (cp860) и, скажем, нордического (cp865) символов в одном файле?

Или это было что-то вроде одной кодовой страницы на одну операционную систему.Например, у PC-DOS из Португалии была только 860 кодовая страница, и пользователь мог использовать символы только из этой кодовой страницы, а у PC-DOS из Скандинавии была только 865 кодовая страница.

Тот же вопрос о Windows.Начиная с какой версии он начал поддерживать многоязычные текстовые документы?

Ответы [ 2 ]

0 голосов
/ 29 апреля 2019

Вы можете делать что угодно в своем собственном файле.Это общение, как читать это другим, это было бы проблемой.

Так что нет, не совсем.Использование более чем одной символьной кодировки в файле и вызов его текстового файла будет более проблематичным, чем оно того стоит.

Какие настройки операционной системы не имеют прямой зависимости от содержимого файла.Программы, которые обмениваются файлами между системами (например, через Интернет) могут использовать понимание исходной кодировки символов и локальные настройки для кодировки символов и выполнять транскодирование с потерями.

Ничего не изменилосьза исключением появления Unicode более 25 лет назад, в одном наборе символов доступно больше сценариев, чем вы можете себе представить.Таким образом, если необходимо выполнить какое-либо перекодирование, в идеале это будет только UTF-8.

0 голосов
/ 29 апреля 2019

DOS на самом деле не знает кодовую страницу. Это были просто строки ASCII (с нулевым или долларовым значением).

Кодовая страница использовалась в основном для отображения: при изменении кодовой страницы изменится способ печати байт-кода на экране.

То, что вы здесь описываете, это частая проблема: смешанное кодирование в одном тексте. Если вы достаточно взрослый, вы будете помнить много таких проблем в сети. Текстовый файл не имеет тега или метаданных о кодовой странице. Если вы смешаете это, вы просто увидите символы в соответствии с активной кодовой страницей. Вы изменяете кодовую страницу экрана и получаете новую интерпретацию символов.

...