Я создал решение, использующее детали из здесь (Kaggle) и здесь (SO) .
В качестве резюме того, что последует, вы должны поместите ваш файл в корзину под вашим облачным проектом Google.
Сначала вам необходимо установить соответствующие библиотеки:
!pip install google-cloud-storage
!pip install pandas
Затем выполните соответствующий импорт:
import pandas as pd
import google.cloud.storage as storage
from io import BytesIO
Затем создайте клиент хранилища, указав свой идентификатор проекта:
storage_client = storage.Client(project = "project-ID")
Определите свой контейнер, указав его имя:
bucket = storage_client.get_bucket("bucket-name")
Создайте blob с данными из файла, который вы хотите прочитать:
blob = storage.blob.Blob("your-file.csv",bucket)
Загрузить содержимое этого блоба в виде строки:
content = blob.download_as_string()
Считать данные в pandas:
data = pd.read_csv(BytesIO(content))
Теперь вы можете просматривать некоторые данные, используя, например, функцию head()
:
data.head()