EMR PySpark "ModuleNotFoundError: нет модуля с именем" spacy "" - PullRequest
0 голосов
/ 09 октября 2019

Я безуспешно пытался установить Spacy на мой кластер EMR для запуска задания Pyspark. Мои действия по начальной загрузке в EMR выглядят примерно так:

pip install --upgrade pip

sudo conda install -c conda-forge spacy
sudo python3 -m spacy download en_core_web_sm
sudo python3 -m spacy download en 

sudo python3 -m pip install -U spacy
sudo python3 -m pip install -U boto3
sudo python3 -m pip install -U pandas
sudo python3 -m spacy download en_core_web_sm
sudo python3 -m spacy download en

Как вы видите выше, я пытался установить его через pip и conda, но ни один из них не работает. Удивительно, когда я использую ноутбук Jupyter и не пытаюсь представить свою работу pyspark как шаг к EMR, она работает.

...