Я довольно новичок в Python, но у меня никогда не было проблем с этим конкретным препятствием раньше.
Я пытаюсь загрузить данные Boston Bluebikes, используя pandas фреймы данных. Каким-то образом данные в Excel выглядят нормально, но при их загрузке возникает куча ошибок и странно выглядящих данных.
Строка кода: jan = pd.read_csv('https://github.com/xixiant/BlueBikes/blob/master/201901-bluebikes-tripdata10.csv', engine='python', header=0, encoding='utf8', error_bad_lines=False)
Некоторые странные данные из jan.head ():
0 html lang = "en"> 1 head> 2 meta charset = "utf-8"> 3 link rel = "dns-prefetch" href = "https://githu... 4 link rel = "dns-prefetch" href = "https://avata...
Вот различные данные, которые я использовал: https://github.com/xixiant/BlueBikes
Что я пробовал на данный момент: 1) прочитайте документацию по pandas .read_csv и перепутайте все параметры, которые имеют смысл (механизм, заголовок, ошибочные строки, кодировка), 2) сохраните CSV с UTF8 3) удалите весь текст в csv 4) Использовал возвышенный текст для кодирования как UTF8 5) скопировал значения в лист google и скачал копию как csv
Я думаю, если бы я продолжал идти по этому пути, я бы посмотрел, есть ли были другие методы чтения в csvs, которые не основаны на pandas, но я действительно чувствую, что смогу преодолеть это, используя pandas.
. ссылки, которые показались мне наиболее перспективными в отношении моего конкретного вопроса: Python Pandas Ошибка токенизации данных https://www.shanelynn.ie/pandas-csv-error-error-tokenizing-data-c-error-eof-inside-string-starting-at-line/
Я не удивлюсь, если я я делаю что-то совершенно нелепое, но человек .. правда? Я только что сошел с базы? Любой совет будет очень признателен.