python pandas read_csv () из URL таблицы Google - PullRequest
2 голосов
/ 26 января 2020

Я хочу загрузить данные по этой ссылке (данные электронной таблицы Google) в мой блокнот Jupyter, используя python.

Я пробовал разные методы, и pandas .read_csv () кажется самым простым. Но я не могу загрузить данные в правильном формате. Вот код, который я использую:

import pandas as pd
url     = 'https://docs.google.com/spreadsheets/d/1itaohdPiAeniCXNlntNztZ_oRvjh0HsGuJXUJWET008/edit#gid=0'
df      = pd.read_csv(url, error_bad_lines=False)
df

Вывод не похож на электронную таблицу:

enter image description here

Возможно, потому что типа данных, которые я не знаю, как исправить. Я пробовал разные способы из других постов, но это не помогло. Вот один из них:

import pandas as pd
import requests 
import io

url     = requests.get('https://docs.google.com/spreadsheets/d/1itaohdPiAeniCXNlntNztZ_oRvjh0HsGuJXUJWET008/edit#gid=0').text
buffer  = io.StringIO(url)
columns = ['ID','age', 'sex','city', 'province', 'country', 
           'wuhan(0)_not_wuhan(1)', 'latitude', 'longitude', 
           'geo_resolution', 'date_onset_symptoms', 'date_admission_hospital', 
           'date_confirmation', 'symptoms', 'lives_in_Wuhan', 'travel_history_dates', 
           'travel_history_location', 'reported_market_exposure', 'additional_information']
df      = pd.read_csv(filepath_or_buffer=buffer, header=1, usecols=columns)

df
...