У меня есть CSV-файл, который был закодирован в "UTF-8", но когда я пытаюсь прочитать этот файл, я сталкиваюсь с множественной проблемой, я пытаюсь прочитать файл, используя этот
df = pd.read_csv("filename.csv",encoding="utf-8")
Я получаю ошибкукодек 'utf-8' не может декодировать байты в позиции 0-1: недопустимый байт продолжения
, но после решения этой проблемы с использованием encoding = "ISO-8859-1 " Я получаю эту ОШИБКУ Ошибка токенизации данных. Ошибка C: Ожидается 2 поля в строке 8, видел 4 , который был снова, я решаю его, используя
df = pd.read_csv("filename.csv",encoding="ISO-8859-1", error_bad_lines=False,lineterminator='\n')
Я получаю это предупреждение b'Skipping строка 6: ожидается 4 поля, увидел 6\ nПропуск строки 17: ожидалось 4 поля, увидел 5 \ n '
, и я не получил полные данные, у меня было 17 столбцов в CSV-файле, и я получил только 4 И когда я проверяю свои данные с помощью
df
df.columns
Я получаю такие данные
Index(['PK',
'à¥ÇDO97*~§Èɸ8ÀOíc
|n¦ÑäEøÿöéºóÀBÉÀ!$}íàÈé;{ìÐå[îñé2þ',
'8æø(%£¦"Dô¹Ò4jÎ0u2jsÐ
ÊMYÞË´äúSì´·· )fåÿ¹CÛöyÑó\tI<\ry',
'ËôïfäÉÇÕß'],
dtype='object')
В моем CSV-файле мое имя столбца данных не такое, фактически все данные поступают в этой форме и показывают только 4 столбца, но яв моем CSV-файле было 17 столбцов