Безопасно ли работать с конфиденциальными данными в Colab? - PullRequest
0 голосов
/ 10 марта 2020

Поработав с ним некоторое время, я хотел бы понять, как на самом деле работает Colab, и в то же время безопасно работать с конфиденциальными данными в нем.

Немного контекста. Я понимаю различия между Python, I Python и Jupyter Notebook, описанные здесь . , и я хотел бы обобщить это, сказав, что Python является языком программирования и может быть установлен как любое другое приложение с помощью sudo кв-прибудет). I Python является интерактивным терминалом командной строки для Python и может быть установлен с помощью pip, стандартного менеджера пакетов для Python. Он позволяет вам устанавливать и управлять дополнительными пакетами, написанными в Python, которые не являются частью стандартной библиотеки Python. Jupyter Notebook добавляет веб-интерфейс и может использовать несколько ядер или бэкэндов, являющихся I Python один из них.

А как насчет Колаба? Насколько я понимаю, при использовании Colab я получаю виртуальную машину от Google с предустановленной Python, а также многие другие библиотеки (или пакеты), такие как pandas или matplotlib. Все эти пакеты установлены в базовой установке python.

Виртуальные машины Colab поставляются с некоторым временным хранилищем. Это эквивалентно хранилищу экземпляров в AWS. Таким образом, оно будет потеряно при прерывании работы виртуальной машины, т. Е. Наша виртуальная машина будет остановлена ​​(или вы бы сказали ... прекращена?) Google. Я считаю, что если бы я загружал свои конфиденциальные данные туда, их не было бы в моем личном су bnet ...

Монтирование , следовательно, наш диск эквивалентен использованию Том EBS в AWS. Том EBS является сетевым диском, поэтому данные в нем сохранятся даже в случае прерывания работы виртуальной машины. Однако тома EBS могут быть подключены только к одному экземпляру EC2 ... но я могу подключить диск к нескольким сеансам Colab. Мне не совсем понятно, что это за сеансы ... Некоторые пользователи хотели бы создать виртуальные среды в Colab , и похоже, что подключение диска - это способ обойти это.

При установке нашего накопителя на Colab нам необходимо пройти аутентификацию, поскольку мы предоставляем IP-адресам виртуальной машины Colab доступ к нашему личному су bnet. Следовательно, если бы у нас были некоторые конфиденциальные данные, используя Colab, эти данные не покинули бы нашу частную компанию su bnet ...?

1 Ответ

0 голосов
/ 10 марта 2020

IIU C, в последнем абзаце задается вопрос: «Могу ли я использовать аутентификацию на основе IP для ограничения доступа к данным в Colab?»

Ответ - нет: фильтрация сетевых адресов не может обеспечить значимый доступ ограничения в Colab.

Colab - это услуга, а не машина. Бэкэнды Colab не имеют фиксированных IP-адресов или фиксированного диапазона IP-адресов. По аналогии, нет списка IP-адресов для ограничения доступа к определенному набору пользователей Google Drive, поскольку, конечно, пользователи Google Drive не имеют фиксированного IP-адреса. Пользователи и серверы Colab похожи.

Вместо того, чтобы пытаться ограничить доступ к IP-адресам, вы захотите ограничить доступ к определенным учетным записям Google, возможно, с использованием типовых списков ACL для файлов на диске.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...