Поработав с ним некоторое время, я хотел бы понять, как на самом деле работает Colab, и в то же время безопасно работать с конфиденциальными данными в нем.
Немного контекста. Я понимаю различия между Python, I Python и Jupyter Notebook, описанные здесь . , и я хотел бы обобщить это, сказав, что Python является языком программирования и может быть установлен как любое другое приложение с помощью sudo кв-прибудет). I Python является интерактивным терминалом командной строки для Python и может быть установлен с помощью pip, стандартного менеджера пакетов для Python. Он позволяет вам устанавливать и управлять дополнительными пакетами, написанными в Python, которые не являются частью стандартной библиотеки Python. Jupyter Notebook добавляет веб-интерфейс и может использовать несколько ядер или бэкэндов, являющихся I Python один из них.
А как насчет Колаба? Насколько я понимаю, при использовании Colab я получаю виртуальную машину от Google с предустановленной Python, а также многие другие библиотеки (или пакеты), такие как pandas или matplotlib. Все эти пакеты установлены в базовой установке python.
Виртуальные машины Colab поставляются с некоторым временным хранилищем. Это эквивалентно хранилищу экземпляров в AWS. Таким образом, оно будет потеряно при прерывании работы виртуальной машины, т. Е. Наша виртуальная машина будет остановлена (или вы бы сказали ... прекращена?) Google. Я считаю, что если бы я загружал свои конфиденциальные данные туда, их не было бы в моем личном су bnet ...
Монтирование , следовательно, наш диск эквивалентен использованию Том EBS в AWS. Том EBS является сетевым диском, поэтому данные в нем сохранятся даже в случае прерывания работы виртуальной машины. Однако тома EBS могут быть подключены только к одному экземпляру EC2 ... но я могу подключить диск к нескольким сеансам Colab. Мне не совсем понятно, что это за сеансы ... Некоторые пользователи хотели бы создать виртуальные среды в Colab , и похоже, что подключение диска - это способ обойти это.
При установке нашего накопителя на Colab нам необходимо пройти аутентификацию, поскольку мы предоставляем IP-адресам виртуальной машины Colab доступ к нашему личному су bnet. Следовательно, если бы у нас были некоторые конфиденциальные данные, используя Colab, эти данные не покинули бы нашу частную компанию su bnet ...?