Откройте Excel с кодировкой ANSI, в Excel 2010 - PullRequest
1 голос
/ 15 ноября 2011

У меня есть файл Excel с кодировкой ANSI (он был сгенерирован в Excel 97), но теперь мне нужно открыть этот файл в Excel 2010, но, похоже, возникла проблема с открытием кодировки ANSI, потому что вместо русских символов я вижу плохие символы: ( Как я могу открыть этот файл в Excel 2010? Я пытался конвертировать xls файл из ANSI в UTF-8 через notepad ++, но он не может конвертировать этот файл :(

1 Ответ

1 голос
/ 17 декабря 2013

Это потому, что языком по умолчанию на вашем компьютере является английский, а не русский

Поэтому вы сможете читать по-русски, только если он был закодирован как UTF-8, UTF-16 (Unicode) или UTF-32

Для преобразования ASCII-8-битного русского текста в производную от Юникода:

1- Скопировать русский текст. 2- В Notepad ++ откройте новый файл, измените Кодировка -> СимволНаборы -> Восточноевропейский

3 - Вставить

4 - Затем, чтобы преобразовать в Unicode, перейдите снова в то же меню: Кодировка -> «Кодировать в UTF-8» и, надеюсь, он станет читабельным

Другой вариант заключается в том, что файл, который вы скопировали, был UTF-8, но без метки порядка байтов (скрытый символ в начале файла, сообщающий программам, что файл является UTF-8) ... Если это так, то некоторыепрограммы определяют кодировку как ASCII вместо UTF-8.Чтобы решить, повторите те же шаги, что и выше, но на шаге 2 вместо выбора пасха-европейский выберите ANSI

Вышеуказанные шаги применимы для большинства языков.Вам просто нужно угадать исходную кодировку перед вставкой в ​​notepad ++, а затем преобразовать через то же меню в альтернативную кодировку на основе Unicode, чтобы увидеть, становятся ли вещи читаемыми.

Большинство языков существуют в 2 формах кодирования: 1-Старая устаревшая форма, всего 8 бит, изначально использовалась большинством компьютеров.Только 8 битов допускают 256 возможностей, из них 128, где обычные латинские и контрольные символы, последние 128 бит читаются по-разному в зависимости от настроек языка ПК. 2- Новый стандарт Unicode (до 32 бит) дает уникальный код для каждого символана всех известных в настоящее время языках и многое другое.если файл в кодировке Unicode, его следует понимать на любом ПК с установленным шрифтом языка.Обратите внимание, что даже UTF-8 идет до 32 бит и имеет такую ​​же ширину, как UTF-16 и UTF-32, он только пытается сохранить 8 бит латинскими символами только для экономии места на диске

...