Когда я запускаю свою работу с облачными потоками данных, я начинаю с импорта нужных мне библиотек (в python). Например:
google-cloud-bigquery==1.3.0
pysftp==0.2.9
google-cloud-storage==1.10.0
pandas==0.23.3
pandas-gbq==0.5.0
jaydebeapi==1.1.1
apache-beam==2.5.0
elasticsearch==6.0.0
Обычно это занимает несколько минут каждый раз, и я использую одну и ту же среду каждый раз, когда использую Cloud Dataflow. Есть ли способ «сохранить» эту среду, чтобы при запуске машины она была «готова»? Я видел «Шаблоны», но упоминалось только о создании переменных и т. Д., На самом деле библиотеки не установлены в среде (или, по крайней мере, я этого не видел).
Если бы кто-нибудь мог показать мне пример сохранения библиотеки в среде, это было бы здорово, например:
elasticsearch==6.0.0