Чтение греческих букв из файла - PullRequest
0 голосов
/ 06 февраля 2020

У меня есть файл .csv с определенным количеством столбцов. Один из столбцов имеет несколько значений, называемых Δ (греческая буква Delta).

Я попытался напечатать письмо, и мне это удалось:

print u'\u0394'

правильно возвращает греческую букву.

Однако, если я пытаюсь выбрать строки файла, содержащего Δ в столбце с именем 'column', используя

file=pd.read_csv('filename.csv',sep=';')
print file[file['column']==u'\u0394']

, я оказываюсь с пустым списком, хотя Я знаю, что в некоторых строках есть Δ в этом столбце.

Что я делаю не так?

1 Ответ

2 голосов
/ 06 февраля 2020

Вы должны добавить encoding='utf-8' в read_csv, потому что python 2 не по умолчанию для строк в кодировке Юникод (а байтовые строки не могут работать с Delta). Вы ничего не получаете, потому что Pandas молча игнорирует ошибку при чтении строки:

file=pd.read_csv('filename.csv', sep=';', encoding='utf-8')
...