Проблема с кодировкой в ​​Python 2.7, используя Pandas, не может прочитать файл с «ñ» и «ó» - PullRequest
0 голосов
/ 24 сентября 2019

Я пытался прочитать большой файл с Пандами, но я действительно не могу.Несмотря на то, что я пытался получить кодировку файла с помощью chardet, Python не смог прочитать символ «-».

Это код, который я пробовал.

def find_encoding(fname):
    r_file = open(fname, 'rb').read()
    result = chardet.detect(r_file)
    charenc = result['encoding']
    return charenc


my_encoding = find_encoding('PermisosCSV\Edificacion_2002.txt')

возвращает кодировку «ISO-8859-1».Затем, когда я пытаюсь

df = pd.read_csv('PermisosCSV\Edificacion_2003.txt', encoding=my_encoding)

и печатаю заголовки с помощью

list(df)

, возвращается [u'A \ xf1o ', u'Mes' ...] вместо['Año', ....].

Кроме того, когда я не пишу кодировку, она возвращает

['A \ xf1o', 'Mes' ...]

...