Открыть с помощью Pandas в Python .xls файл, который поврежден - PullRequest
0 голосов
/ 06 февраля 2020

Так вот в чем проблема, я пытаюсь импортировать DF из файла, загруженного с COGNOS . В Cognos я выбираю формат .CSV , но всегда загружается в формате .xls

. Будет очень легко открыть файл .xls и сохранить его как CVS, но проблема в том, что в файле больше строк, чем в Excel, поэтому в процессе я потеряю много данных. Также, когда я открываю файл в Excel, появляется предупреждение, что файл может быть поврежден.

Когда я пытаюсь открыть данные с помощью df = pd.read_excel("Time Series 2018-1.xls"), это показывает следующую проблему.

XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\xff\xfeP\x00r\x00o\x00'

ПОМОГИТЕ

Ответы [ 2 ]

0 голосов
/ 07 февраля 2020

Я уже решил это. Просто откройте файл в превосходной форме и сохраните в кодировке UTF-8 . Затем просто откройте его с помощью df = pd.read_csv("Prueba1.xls", sep = "\t", encoding = 'utf8'), потому что, как сказал @dougp, просто сохраните файл csv с расширением xls.

Я думаю, что есть способ изменить кодировку в PYTHON, но это уже другой вопрос .

0 голосов
/ 06 февраля 2020

Вы можете попробовать

  1. Изменить имя файла, удалить пробелы и da sh, затем повторить попытку
  2. , следуйте по этой pandas официальной ссылке
...