Да, локальное хранилище ноутбука Colab сейчас составляет около 40 ГиБ.Один способ увидеть точное значение (в Python 3):
import subprocess
p = subprocess.Popen('df -h', shell=True, stdout=subprocess.PIPE)
print(str(p.communicate()[0], 'utf-8'))
Однако: для больших объемов данных, локальное хранилище является неоптимальным способом подачи TPU, которыйне подключен напрямую к машине, на которой работает ноутбук.Вместо этого рассмотрите возможность хранения своего большого набора данных в хранилище GCP и получения этих данных из записной книжки Colab.(Более того, объем локального хранилища Colab может измениться, и срок действия самого ноутбука Colab истечет через несколько часов, а вместе с ним и локальное хранилище.)
Взгляните на канонический ноутбук TPU Colab .Внизу есть несколько следующих шагов, которые включают ссылку на Поиск Шекспира с ТПУ .В этой записной книжке приведен следующий фрагмент кода, который демонстрирует аутентификацию GCP для вашего Colab TPU.Это выглядит так:
from google.colab import auth
auth.authenticate_user()
if 'COLAB_TPU_ADDR' in os.environ:
TF_MASTER = 'grpc://{}'.format(os.environ['COLAB_TPU_ADDR'])
# Upload credentials to TPU.
with tf.Session(TF_MASTER) as sess:
with open('/content/adc.json', 'r') as f:
auth_info = json.load(f)
tf.contrib.cloud.configure_gcs(sess, credentials=auth_info)
# Now credentials are set for all future sessions on this TPU.
else:
TF_MASTER=''