Какую кодировку символов используют следующие немецкие слова? - PullRequest
0 голосов
/ 28 ноября 2011

Я пытаюсь обработать список немецких слов и не могу выяснить, в какой кодировке находится файл. Команда unix 'file' говорит, что файл "Текст не-ISO Extended-ASCII". Большинство слов в ascii, но вот исключения:

ANDR\x82
ATTACH\x82
C\x82ZANNE
CH\x83TEAU
CONF\x82RENCIER
FABERG\x82
L\x82VI-STRAUSS
RH\x93NETAL
P\xF2ANGE

Любые намеки были бы великолепны. Спасибо!

РЕДАКТИРОВАТЬ: Для ясности вышеупомянутые шестнадцатеричные коды являются строковыми литералами C, поэтому замените \ xXX на шестнадцатеричное литеральное значение XX.

1 Ответ

4 голосов
/ 28 ноября 2011

Похоже, что CP437 или CP852 , предполагая, что последовательности \x82 кодируют отдельные символы и не являются буквально четырьмя символами. Ну, по крайней мере, все остальное делает, но последняя строка немного загадка.

...