Как конвертировать следующие китайские иероглифы? - PullRequest
0 голосов
/ 25 октября 2011

Мне дали текст для показа в моей программе.Однако я открыл его в textedit и текст не читается.Мне сказали, что это китайские иероглифы.Что мне нужно сделать, чтобы сделать его читабельным?

•—§WƸ¨v∞”¡`∑|™∫•|¶Ï•N™Ì

Я использую OSX, чтобы открыть этот файл.Файл в текстовом формате.Это выше пример строки.

1 Ответ

2 голосов
/ 26 октября 2011

• —§WƸ¨v∞ ”¡` ∑ | ™ ∫ • | ¶Ï • N ™ Ì

Это то, что вы получаете, если читаете текстфайл в кодировке MacRoman , когда он на самом деле содержит что-то еще.

Вероятно, это только ваш текстовый редактор, который угадал MacRoman, потому что ему больше нечего продолжать.Возможно, что текстовый файл искажен и сохранен с этими символами в UTF-чем-то, но гораздо более вероятно, что байты вашего файла:

A5 D1 A4 57 AE FC AC 76 B0 D3 C1 60 B7 7C AA BA A5 7C A6 EC A5 4E AA ED

И эти байты очень похожи на Big-5,Расшифровывая их с помощью кодировки Big-5, вы получаете:

由上海洋商總會的四位代表

Что выглядит весьма вероятным.

Таким образом, чтобы прочитать файл, возьмите байты и декодируйте их, используя кодировку Big-5.То, как вы это сделаете, зависит от того, какой язык вы используете.

...