Ошибка в Python Pandas при чтении файла CSV - PullRequest
0 голосов
/ 30 сентября 2019

Я пытаюсь прочитать файл CSV, но выдает ошибку. Я не могу понять, в чем проблема с моим синтаксисом, или мне нужно добавить дополнительные атрибуты для моего read_csv.

Я пробовал решение на

UnicodeDecodeError: 'utf-8'кодек не может декодировать байт 0x96 в позиции 21: также недопустимый начальный байт. Но он не работает

import pandas as pd


#Assign file_path variable
file_path = 'rawdump_24th_Sep.csv'

#assign dataframe
df1 = pd.read_csv(file_path,index_col=0)

df.head()

[ОШИБКА]

UnicodeDecodeError Traceback (последний вызов был последним) pandas / _libs / parsers.pyx вpandas._libs.parsers.TextReader._convert_tokens ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._convert_with_dtype ()

pandas / _lix / parpy. pandas._libs.parsers.TextReader._string_convert ()

pandas / _libs / parsers.pyx в pandas._libs.parsers._string_box_utf8 ()

UnicodeDecodeError: код может 'utf-8't декодировать байт 0x96 в позиции 21: недопустимый начальный байт

Во время обработки вышеуказанного исключения произошло другое исключение:

UnicodeDecodeError Traceback (последний вызов был последним) в 6 7 #assign dataframe --> 8 df1 = pd.read_csv (file_path, index_col = 0) 9 10 df.head ()

~ \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py в parser_f (filepath_or_buffer), sep, разделитель, заголовок, имена, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dтип, движок, конвертеры, true_values, false_values, skipinitialspace, skiprows, skipfooter, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime__format, keep_date_col, date_strate_strate, Date_Sizequotechar, цитирование, двойная кавычка, escape-символ, комментарий, кодирование, диалект, tupleize_cols, error_bad_lines, warn_bad_lines, delim_whitespace, low_memory, memory_map, float_precision) 700 skip_blank_lines = skip_blank_lines) 701 -> 702 * 70_w_f_server_F_FR_F_FR_F_FR_FER_FOR_FOR_FOR_FOR_WORF1029 * name = name

~ \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py в _read (filepath_or_buffer, kwds) 433 434 попытаться: -> 435 data = parser. читать (nrows) 436 окончательно: 437 parser.close ()

~ \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py in read (self, nrows) 1137 def read (self, nrows= Нет): 1138 nrows = _validate_integer ('nrows', nrows) -> 1139 ret = self._engine.read (nrows)1140 1141 # Может изменять столбцы / col_dict

~ \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py в режиме чтения (self, nrows) 1993 def read (self, nrows = None): 1994try: -> 1995 data = self._reader.read (nrows) 1996 за исключением StopI изменения: 1997, если self._first_chunk:

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader.read ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._read_low_memory ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._read_rows (

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._convert_column_data ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._convert_tok

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._convert_with_dtype ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._string_convert

pandas / _libs / parsers.pyx в pandas._libs.parsers._string_box_utf8 ()

UnicodeDecodeError: 'Кодек utf-8 'не может декодировать байт 0x96 в позиции 21: недопустимый начальный байт`

ОБНОВЛЕНО

import pandas as pd


#Assign file_path variable
file_path = 'rawdump_24th_Sep.csv'

#assign dataframe
df1 = pd.read_csv(file_path,index_col=0)

df1.head()

UnicodeDecodeError Traceback (последний вызов был последним) pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._convert_tokens ()

pandas / _libs / parsers.pyx в pandas._libs.parsers. TextReader._convert_with_dtype ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._string_convert ()

pandas / _libs / parsers.pyx в pandas._libs.parsers. _string_box_utf8 ()

UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0x96 в позиции 21: недопустимый начальный байт

Во время обработки вышеуказанного исключения произошло другое исключение:

UnicodeDecodeError Traceback (последний из последних вызовов) в 6 7 #assign dataframe ----> 8 df1 = pd.read_csv (file_path, index_col = 0) 9 10 df1.head ()

~ \Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py в parser_f (filepath_or_buffer, sep, разделитель, заголовок, имена, index_col, usecols, squeeze, prefix, mangle_dupe_cols, dtype, engine, преобразователи, true_values, false_values, skipinitial, skipinitialskiprows, skipfooter, nrows, na_values, keep_default_na, na_filter, verbose, skip_blank_lines, parse_dates, infer_datetime_format, keep_date_col, date_parser, dayfirst, итератор, chunksize, сжатие, тысячи, десятичное число, комментирование, квотирование, строка-квататор, квотированиеdialect, tupleize_cols, error_bad_lines, warn_bad_lines, delim_whitespace, low_memory, memory_map, float_precision) 700 skip_blank_lines = skip_blank_lines) 701 -> 702 возвращать _read (filepath_or_buffer, kwds) 703 7079 * имя

~ \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py в _read (filepath_or_buffer, kwds) 433 434 попытаться: -> 435 data = parser.read (nrows) 436 окончательно: 437 parser.close ()

~ \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py в режиме чтения (self, nrows) 1137 def read (self, nrows = None): 1138 nrows = _validate_integer ('nrows', nrows) -> 1139 ret = self._engine.read (nrows) 1140 1141 # Может изменять столбцы / col_dict

~ \ Anaconda3 \ lib \ site-packages \ pandas \ io \ parsers.py в read (self, nrows) 1993 def read (self, nrows = None): 1994 try: -> 1995 data = self._reader.read (nrows) 1996 кроме StopItered: 1997, если self._first_chunk:

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader.read ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader. _read_low_memory ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._read_rows ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader. _convert_column_data ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._convert_tokens ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.Text. _convert_with_dtype ()

pandas / _libs / parsers.pyx в pandas._libs.parsers.TextReader._string_convert ()

pandas / _libs / parsers.pyx в pandas._libs.parsers._fring)

UnicodeDecodeError: кодек «utf-8» не может декодировать байт 0x96 в позиции 21: недопустимый начальный байт

1 Ответ

0 голосов
/ 30 сентября 2019

'rawdump_24th_Sep.csv' должен находиться в той же папке, где сохранен файл .py

import pandas as pd
df1 = pd.read_csv('rawdump_24th_Sep.csv')
df1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...