Я получил файлы, которые, к сожалению, я не могу получить информацию о том, как они были созданы.Мне нужно проанализировать эти файлы.
Файл полностью ASCII, кроме одного символа: 0xDB (в десятичном виде он дает 219).
Очевидно (при просмотре файла) этот символ являетсясимвол валюты.Я знаю это, потому что:
- обязательно, чтобы эти файлы содержали символ валюты везде, где появляется сумма
- нет другого символа валюты (ни $, ни евро, ни ничего) нигде вфайлы
- каждый раз, когда 0xDB появляется рядом с количеством
I думаю , что в этих файлах 0xDB должен представлять символ евро (этона самом деле очень вероятно, что этот 0xDB появляется везде, где должен появляться символ евро).
Команда file говорит это о файлах:
ISO-8859 English text, with CRLF, LF line terminators
An hexdump дает следующее:
00000030 71 75 61 6e 74 20 db 32 2e 36 30 0a 20 41 49 4d |quant .2.60. AIM|
^^ ^
Все файлы обычно отформатированы / разбираются.На самом деле, я получаю всю информацию отлично, кроме этого странного символа 0xDB.
Кто-нибудь знает, что происходит?Как символ валюты (предположительно символ евро) каким-то образом стал 0xDB?
Это ни ISO-8859-1 (он же ISO Latin 1), ни ISO-8859-15, потому что в обоих случаях кодовая точка 219 соответствует'Û' (точно так же, как кодовая точка Unicode 219 равна 'LATIN CAPCITAL LETTER U WITH CIRCUMFLEX' ).
Это не расширенный-ASCII.