кодировка текстового файла корректно отображается на терминале, а не в редакторе - PullRequest
0 голосов
/ 07 октября 2011

У меня проблема с кодировкой текстового файла.

Если я открою его с помощью * nix терминальных инструментов, таких как less, cat или more, символы с акцентом будут отображаться правильно.Но если я открою его любым редактором (например, vim), акцентированные символы будут зашифрованы.

Мой языковой стандарт терминала установлен на UTF-8, мой редактор (vim) имеет кодировку по умолчанию, установленную на UTF-8.Если я открываю textfile.txt с помощью vim, я вижу зашифрованные акценты, либо я устанавливаю кодировку vim на UTF-8 или ISO8859-1.

Вывод утилиты работы с файлами:

$ file textfile.txt
textfile.txt: ISO-8859 English text, with very long lines

Iуже попробовал следующее с iconv:

iconv -f iso-8859-1 -t utf-8 textfile.txt > textfile.utf8.txt

Я получаю это

$ file textfile.utf8.txt
textfile.utf8.txt: UTF-8 Unicode English text, with very long lines

Открытие его с помощью vim продолжает показывать зашифрованные акценты, и на этот раз акценты зашифрованы, даже если я использую cat или более.

Моя цель - получить этот файл в формате UTF-8 и, очевидно, правильно отобразить акцентированные символы.

[Грубый способ сделать это - скопировать каждый экран выводавведите команду «more» и вставьте ее в редактор.Должен быть более разумный способ сделать это.]

Спасибо за любую помощь.

1 Ответ

0 голосов
/ 16 апреля 2012

Оказалось, что файл содержит символы из двух разных кодировок, поэтому визуализации были так скремблированы в каждом случае, и iconv не удалось успешно преобразовать файл.Спасибо всем в любом случае

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...