CSV-файл загружается не полностью или правильно с использованием pandas кадра данных - PullRequest
0 голосов
/ 17 февраля 2020

Я довольно новичок в Python, но у меня никогда не было проблем с этим конкретным препятствием раньше.

Я пытаюсь загрузить данные Boston Bluebikes, используя pandas фреймы данных. Каким-то образом данные в Excel выглядят нормально, но при их загрузке возникает куча ошибок и странно выглядящих данных.

Строка кода: jan = pd.read_csv('https://github.com/xixiant/BlueBikes/blob/master/201901-bluebikes-tripdata10.csv', engine='python', header=0, encoding='utf8', error_bad_lines=False)

Некоторые странные данные из jan.head ():

0 html lang = "en"> 1 head> 2 meta charset = "utf-8"> 3 link rel = "dns-prefetch" href = "https://githu... 4 link rel = "dns-prefetch" href = "https://avata...

Вот различные данные, которые я использовал: https://github.com/xixiant/BlueBikes

Что я пробовал на данный момент: 1) прочитайте документацию по pandas .read_csv и перепутайте все параметры, которые имеют смысл (механизм, заголовок, ошибочные строки, кодировка), 2) сохраните CSV с UTF8 3) удалите весь текст в csv 4) Использовал возвышенный текст для кодирования как UTF8 5) скопировал значения в лист google и скачал копию как csv

Я думаю, если бы я продолжал идти по этому пути, я бы посмотрел, есть ли были другие методы чтения в csvs, которые не основаны на pandas, но я действительно чувствую, что смогу преодолеть это, используя pandas.

. ссылки, которые показались мне наиболее перспективными в отношении моего конкретного вопроса: Python Pandas Ошибка токенизации данных https://www.shanelynn.ie/pandas-csv-error-error-tokenizing-data-c-error-eof-inside-string-starting-at-line/

Я не удивлюсь, если я я делаю что-то совершенно нелепое, но человек .. правда? Я только что сошел с базы? Любой совет будет очень признателен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...