Найти кодировку этой байтовой строки - PullRequest
0 голосов
/ 18 сентября 2018

Хорошо, это, вероятно, очень расплывчатый некорректный вопрос ... но я все равно попробую.

Я прочитал в первой строке файла .data, используя

with open('raw_000.data', 'rb') as f:
    A = f.readline()

(используя только 'r', использовалась кодировка UTF-8, и это не удалось).

Это дало мне следующую строку байтов

б '\ x10 \ xa2 \ x8f \ XBC-X \ x98? \ XFE \ xd4 \ x17> \ XDD \ XDA \ x0e \ XBF \ XDc \ xc5d? Е \ x19 \ x91? \ Xe0m \ XB0 <\ xe7 \ xa8R @ = \ XCA \ XBD> \ x94 \ x91 \ XB2 \ XBF \ Xba \ xb3u>) \ XBE \ x01 \ xc0 \ x05 \ x1f \ x83 \ XBF # \ x04 \ XE2 \ XBF \ x80 \ XBD; > \ xe5 \ x0e <\ xc0 \ x0cS0? \ XBD \ xcaG? \ x15 \ x9c \ X07 \ xc0lX \ x9d? \ xc5 \ xa3j \ xc0X + D \ xc0T \ x91 \ XAD? \ x13 \ x87 \ XDD \ xbfjCs ? м \ XDD \ x02 @ \ xebBi \ XBF \ хк \ xd8g = * NM \ XBF & \ x94 & \ xc0 \ x94 \ x91 \ XB2? = \ XCA \ XBD> \ хк \ xbfm \ XBF \ xf5 \ x96 \ x9f? \ XF4 \ x8b \ xc0 \ xbfAz \ x12 @ X \ xc6 \ Xee \ XBE \ x84 \ т \ XCF \ XBF \ x1d \ XDB \ x93 \ xbfpw \ x19 \ xc0 \ XBC \ xe0 \ x85> | \ xd5 \ xa1 ? \ xe5 \ x0e \ XBC \ x80 \ XBD \ Xbb = |? \ xc0 \ xf7 \ XBE \\ xc5 \ XDA \ XBE \ xacB \ xe4 \ XBF \ x99 \ Xbb \ г @ NGB \ XBF \ хаа \ XBD ~ @; \ xc0 \ xf2 \ XBF \ x1a \ xd1 \ xc8> \ XDc \ xc5 \ xe4 \ xbfe \ x19 \ x11 \ xc0 \ x10 \ xa2 \ x8f <-Х \ x98 \ XBF \ п '</p>

Теперь это должно содержать некоторые значимые данные. Но я понятия не имею, как это "декодировать", как в ... какой тип декодирования ... Все, что я знаю, это то, что

chardet.detect('...')

дал

{'confidence': 0.0, 'encoding': None}.

И, кроме того, файл raw_000.data поступает с МРТ-аппарата Филипса. Однако я также не смог найти никакой документации в этой области.

Какие еще есть варианты?

1 Ответ

0 голосов
/ 18 сентября 2018

Ну, по-видимому, есть нечто, называемое Little Endian Ordering.Никогда ничего не знал об этом, но, к счастью, есть страница в Википедии

https://en.wikipedia.org/wiki/Endianness

И, конечно, мы можем передать эту информацию также на python, используя пакет "struct", например, так:

import struct

with open('your_byte_file', 'rb') as f:
   A = f.readline()

res = struct.unpack('<f', A)

Здесь мы имеем, что знак < говорит нам, что мы имеем дело с небольшим порядком байтов, details f говорит нам, что мы ожидаем плавание, детали .

...