Панды read_excel преобразование специального характера - PullRequest
0 голосов
/ 06 июня 2018

Я читаю данные из Excel и записываю их в файл CSV.

osht = pd.read_excel(ip_path,header=None,sheet_name=j,encoding='utf-8-sig')
osht.to_csv(file_name,sep=',',index=False,encoding='utf-8-sig')

В файле Excel есть несколько строк, содержащих специальные символы, такие как:

'SOCIÉTÉ', 'HERMÈS '

Панды изменяет такие слова на:

' SOCIà © Tà © ',' HERMÊS '

Я попытался изменить метод кодированияна 'utf-8', 'utf_16_le', но проблема все еще сохраняется.

Пожалуйста, предложите, что нужно сделать в таком случае.

1 Ответ

0 голосов
/ 06 июня 2018

'SOCIà © Tà ©', 'HERMÊS'

Это говорит о том, что полученный файл не имеет кодировки UTF-8.

...