Вы можете использовать емкость хранилища GoogleDrive. Colab позволяет вам хранить эти данные на вашем диске и получать к ним доступ из книжки colab следующим образом:
from google.colab import drive
import matplotlib.image as mpimg
import matplotlib.pyplot as plt
import pandas as pd
drive.mount('/content/gdrive')
img = mpimg.imread(r'/content/gdrive/My Drive/top.bmp') # Reading image files
df = pd.read_csv('/content/gdrive/My Drive/myData.csv') # Loading CSV
Когда он монтируется, он попросит вас посетить конкретный URL-адрес, чтобы предоставить разрешение на доступ к диску. Просто вставьте полученный токен. Необходимо сделать только один раз.
Лучшее в colab - это то, что вы также можете запускать командные оболочки из кода, все, что вам нужно сделать, это поставить перед командами префикс !
(удар). Полезно, когда вам нужно расстегнуть молнию и т. Д.
import os
os.chdir('gdrive/My Drive/data') #change dir
!ls
!unzip -q iris_data.zip
df3 = pd.read_csv('/content/gdrive/My Drive/data/iris_data.csv')
Примечание: Поскольку вы указали, что объем данных составляет около 30 ГБ, это может быть бесполезно, если вы находитесь на бесплатном уровне, предоставляемом Google (поскольку он предоставляет только 15 ГБ на учетную запись), возможно, вам придется посмотри в другом месте.
Вы также можете посетить этот конкретный вопрос для получения дополнительных решений по Kaggle интеграции с Google Colab .