Возникла проблема с чтением CSV-файла в пандах, данные не отображаются правильно - PullRequest
0 голосов
/ 14 октября 2019

У меня есть CSV-файл, который был закодирован в "UTF-8", но когда я пытаюсь прочитать этот файл, я сталкиваюсь с множественной проблемой, я пытаюсь прочитать файл, используя этот

df = pd.read_csv("filename.csv",encoding="utf-8")

Я получаю ошибкукодек 'utf-8' не может декодировать байты в позиции 0-1: недопустимый байт продолжения

, но после решения этой проблемы с использованием encoding = "ISO-8859-1 " Я получаю эту ОШИБКУ Ошибка токенизации данных. Ошибка C: Ожидается 2 поля в строке 8, видел 4 , который был снова, я решаю его, используя

df = pd.read_csv("filename.csv",encoding="ISO-8859-1", error_bad_lines=False,lineterminator='\n')

Я получаю это предупреждение b'Skipping строка 6: ожидается 4 поля, увидел 6\ nПропуск строки 17: ожидалось 4 поля, увидел 5 \ n '
, и я не получил полные данные, у меня было 17 столбцов в CSV-файле, и я получил только 4 И когда я проверяю свои данные с помощью

df
df.columns

Я получаю такие данные

Index(['PK',
       'à¥ÇDO97*~§Èɸ8ÀOíc
|n¦ÑäEøÿöéºóÀBÉÀ!$}íàÈé;{ìÐå[îñé2þ',
       '8æø(%£¦"Dô¹Ò4jÎ0u2jsÐ
ÊMYÞË´äúSì­´·· )fåÿ¹CÛöyÑó\tI<\ry',
       'ËôïfäÉÇÕß'],
      dtype='object')

В моем CSV-файле мое имя столбца данных не такое, фактически все данные поступают в этой форме и показывают только 4 столбца, но яв моем CSV-файле было 17 столбцов

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...