Панды read_csv с многопоточным заголовочным xls файлом - PullRequest
0 голосов
/ 01 мая 2018

Как я могу прочитать заголовок следующего файла xls, используя pandas?

xls file

Все заголовки столбцов, такие как DATE, BENCHMARK NAME, находятся в строке 3, а значения процентиля "1ST (PERCENT)" - в строке 4.

Когда я пытаюсь:

df = pd.read_csv(xls_url, skiprows=[0,1,7], header=3) # or header=[3,4]

Я получаю следующую ошибку:

ParserError: Error tokenizing data. C error: Expected 1 fields in line 13, saw 2

1 Ответ

0 голосов
/ 01 мая 2018

Вы не должны использовать read_csv для файла .xls. Если вы сохраните файл в формате .csv, вы увидите, как выглядит заголовок .csv, и он должен быть простым.

В противном случае используйте read_excel ( документация ). Это должно быть в соответствии с:

pd.read_excel(xls_url, skiprows=3)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...