как обработать ошибку при чтении файла, содержащего несколько языков - PullRequest
0 голосов
/ 04 июня 2018

данные пытаются прочитать Я пытался разными способами, все еще получая ошибки другого типа.

import codecs
f = codecs.open('sampledata.xlsx', encoding='utf-8')
for line in f:
  print (repr(line))

другой способ, которым я пытался это

f = open(fname, encoding="ascii", errors="surrogateescape")

все еще не повезло. любая помощь?

1 Ответ

0 голосов
/ 04 июня 2018

Более новые версии Pandas поддерживают xlxs.

file_name =  # path to file + file name
sheet =  # sheet name or sheet number or list of sheet numbers and names

import pandas as pd
df = pd.read_excel(io=file_name, sheet_name=sheet)
print(df.head(5))  # print first 5 rows of the dataframe

Прекрасно работает, особенно если вы работаете со многими листами.

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...