Я пытался прочитать большой файл с Пандами, но я действительно не могу.Несмотря на то, что я пытался получить кодировку файла с помощью chardet, Python не смог прочитать символ «-».
Это код, который я пробовал.
def find_encoding(fname):
r_file = open(fname, 'rb').read()
result = chardet.detect(r_file)
charenc = result['encoding']
return charenc
my_encoding = find_encoding('PermisosCSV\Edificacion_2002.txt')
возвращает кодировку «ISO-8859-1».Затем, когда я пытаюсь
df = pd.read_csv('PermisosCSV\Edificacion_2003.txt', encoding=my_encoding)
и печатаю заголовки с помощью
list(df)
, возвращается [u'A \ xf1o ', u'Mes' ...] вместо['Año', ....].
Кроме того, когда я не пишу кодировку, она возвращает
['A \ xf1o', 'Mes' ...]