Как правильно читать символы Юникода - PullRequest
1 голос
/ 01 сентября 2009

У меня есть текстовый файл, содержащий, как мне говорят, символы Юникода, например:

\320\222\320\21015-25'ish per main or \320\222\320\21020-40'ish per starter

Что следует читать:

£15-25'ish per main or £20-40'ish per main starter

Однако при просмотре этого текста в Firefox вывод искажается различными нежелательными символами.

Так это действительно юникодные символы? И если да, как я могу преобразовать их в форму, которая отображается правильно?

1 Ответ

3 голосов
/ 01 сентября 2009

Вам необходимо:

  • знать кодировку текстового файла
  • чтение данных без потери информации (либо путем чтения их в двоичном виде, либо путем чтения в виде текста с правильной кодировкой)
  • записать данные в правильной кодировке (либо записав их в двоичном виде и указав исходную кодировку, либо записав их в виде текста в кодировке, которую вы также указываете в заголовках)

Попробуйте разделить проблему на «чтение» и / или «письмо». Вы знаете кодировку файла? Что вы должны сделать с файлом? Когда вы написали это с обратной косой чертой, это на самом деле , что находится в файле (то есть экранированная форма), или это на самом деле просто "нормальная" кодировка текста, такая как UTF-8?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...