Как изменить кодировку символов этого файла с помощью iconv или перекодировать? - PullRequest
1 голос
/ 06 декабря 2011

У меня есть текстовый файл в кодировке ISO-8859-1.Мне это нужно в кодировке utf-8.Firefox правильно отображает кавычки и символы одинарных кавычек, но gedit не показывает:
Firefox:
Для Home Depot?
«Абсолютно», - сказал он тогда.
Home Depot сказал решение Нарделли

gedit:
Для The Home Depot?
Совершенно верно, - сказал он в то время.
Home Depot сказал, что решение Нарделли

Я пытался:

iconv -f ISO-8859-1 -t UTF-8 Bus16451112.txt > iconv.txt

и

recode ISO-8859-1..UTF-8 Bus16451112.txt

Оба не работали.После преобразования Firefox отображает неправильные символы тоже независимо от того, выберу ли я utf-8 (Абсолютно, он сказал в то время.) Или ISO-8859-1 («Абсолютно,» он сказал тогда) в меню представления..

Что мне нужно сделать, чтобы преобразовать этот файл в UTF-8, чтобы он отображался правильно?

1 Ответ

2 голосов
/ 07 декабря 2011

Ваш текстовый файл наверняка не закодирован в ISO-8859-1, так как этот набор символов не содержит символов типографских кавычек.Кодировка, вероятно, Windows-1252 , которая заменяет некоторые управляющие символы ISO-8859-1 другими более полезными символами.Вы должны быть в состоянии преобразовать это с iconv как это:

iconv -f Windows-1252 -t UTF-8 q8402932.txt > iconv.txt
...