Python расшифровывает лист Excel без панд - PullRequest
0 голосов
/ 08 июля 2019

Я пытаюсь прочитать файл Excel в python без использования pandas или xlrd, и я пытаюсь преобразовать результаты из bytes в utf-8 без какого-либо успеха.

данные из файла xls

colA    colB    colC
spc     1D0     20190705
spd     1D0     20190705
spe     1D0     20190705
... (goes on for 500k lines)

код

with open(file, 'rb') as f:
    data = f.readlines(1)  # Just to check the first line that is printed out
    print(data[0].decode('utf-8'))

Я получаю ошибку UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 0: invalid continuation byte

Если бы я напечатал data без его декодирования, результат был бы: [b'\xd0\xcf\x11\xe0\xa1\xb1\x1a\xe1\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00>\x00\x03\x00\xfe\xff\t\x00\x06\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x9e\x00\x00\x00\x9dN\x00\x00\x00\x00\x00\x00\x00\x10\x00\x00\xfe\xff\xff\xff\x00\x00\x00\x00\xfeM\x00\x00\x01\x00\x00\x00\xffM\x00\x00\x00N\x00\x00\x01N\x00\x00\x02N\x00\x00\x03N\x00\x00\x04N\x00\x00\x05N\x00\x00\x06N\x00\x00\x07N\x00\x00\x08N\x00\x00\tN\x00\x00\n']

Нет никаких причин, по которым я не хочу использовать pandas или xlrd, я просто пытаюсь при необходимости проанализировать данные только со стандартными библиотеками.

Есть мысли?

1 Ответ

0 голосов
/ 08 июля 2019

Вам необходимо сначала распаковать файл xlsx, прежде чем вы сможете прочитать его содержимое (при условии, что это формат, который вы используете).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...