Код utf-8 c не может декодировать байт 0x92 в позиции 11: недопустимый начальный байт - PullRequest
0 голосов
/ 10 марта 2020

Я пытаюсь преобразовать все CSV-файлы из папки в xlsx и используя приведенный ниже код.

import glob
import csv
import pandas as pd
files = glob.glob('D:\cf111\*.csv')
for k in files:
    df = pd.read_csv(k)
    df.to_excel("abc.xlsx")

Код генерирует следующую ошибку.

utf-8' codec can't decode byte 0x92 in position 11: invalid start byte

Я не могу разобраться, как устранить эту ошибку.

1 Ответ

0 голосов
/ 10 марта 2020

Возможно, проблема в том, что в csv есть содержимое, которое не поддерживает encoding = "utf-8". Вы можете попробовать использовать другую кодировку , хотя.

пример кода:

import glob
import csv
import pandas as pd
files = glob.glob('D:\cf111\*.csv')
for k in files:
    df = pd.read_csv(k, encoding='ISO 8859-1')
    df.to_excel("abc.xlsx")

ссылка на документ: https://docs.python.org/3/library/codecs.html#standard -encodings

...