Когда файл Excel экспортируется с использованием формата вывода CSV Comma Separated
, кодировка, выбранная в Инструменты -> Веб-опция -> Кодировка в Excel * Save As...
* Диалоговое окно 1008 * фактически не генерирует ожидаемый результат:
Текстовый файл сохраняется с использованием кодировки относительно текущего языка, выбранного в приложении Excel, а не выбранной кодировки Unicode (UTF16-LE) или UTF-8 (которая игнорируется), ни кодировка по умолчанию, определяемая текущим языком системы.
Чтобы импортировать файл CSV
, вы можете использовать метод Encoding.GetEncoding () , чтобы указать Имя или CodePage
Кодировки, использованной на машине, сгенерировавшей файл: опять же, не кодировка, относящаяся к языку системы, а кодировка языка, который в настоящее время используется приложением Excel.
CodePage 1252 (Windows-1252
) и ISO-8859-1 обычно используются в зоне Latin1.
На основе символов, на которые вы ссылаетесь, это, скорее всего, оригинальная кодировка.
В Windows используйте первую. ISO-8859-1
все еще используется, в основном на старых веб-страницах (или веб-страницах, созданных без учета используемой кодировки).
Как примечание, CodePage 1252
и ISO-8859-1
не совсем одинаковые кодировки, есть незначительные различия. Если вы найдете документацию, в которой говорится об обратном, документация неверна.