Доступность пакетов при обновлении Anaconda - PullRequest
0 голосов
/ 18 октября 2018

У нас есть старая версия Anaconda, загруженная в виде пакета на наш кластер Hadoop cloudera, и мы хотели обновить ее до последней версии.В более старой версии по умолчанию мы не нашли пакетов tenorflow, геопанд, noaa_sdk, thrift_sasl, gensim и некоторых других, которые необходимы для нашего случая использования науки о данных.Мы установили их вручную через кластер.

Мой вопрос будет, если я обновлю Anaconda, будут ли доступны пакеты, которые устанавливаются вручную?Или я должен установить их снова?

1 Ответ

0 голосов
/ 18 октября 2018

Полагаю, вы установили Anaconda на узлы hadoop, используя посылки Cloudera?

https://www.cloudera.com/downloads/partner/anaconda.html

Если да, то вы правы, вам придется переустановить все, что вы установили поверх узлов hadoop.

Cloudera выглядитпри посылках как " неизменный " - их состояние не должно меняться.Поэтому, когда вы устанавливаете что-либо поверх посылок или изменяете их каким-либо образом, ожидайте, что ваши изменения могут быть потеряны.(например, перераспределение посылок, так как он будет разархивировать посылки снова) То же самое относится и к обновлениям - новая версия Anaconda поставляется только с новым файлом tar (это то, чем в основном является посылка, с некоторой информацией метаданных).

ЕслиВы заинтересованы в управлении средами Python - посмотрите на conda виртуальную среду - https://conda.io/docs/user-guide/overview.html

или conda-pack специально в качестве примера для Spark на YARN - https://conda.github.io/conda-pack/spark.html

В настоящее время мы переносим все наши задания Spark в conda среды вместо того, чтобы полагаться на посылки Anaconda.

PS.Я заметил, что вы используете тег python-2.7 для этой темы.Обратите внимание, что бесплатные посылки Anaconda Cloudera (начиная с версии Anaconda 5) больше не предоставляют Python2.Это придет с Python3 там.Осторожно!Это изменение застало нас врасплох.И это было еще одной причиной для перехода на conda, поскольку теперь мы можем легко переключаться между Python2 и Python3 в зависимости от проекта.

...