Понял!Я обновил spark
, а ядро pyspark
не знало об этом.
Первое: какие kernels
установлены:
$jupyter kernelspec list
Available kernels:
python2 /Users/sboesch/Library/Python/2.7/lib/python/site-packages/ipykernel/resources
ir /Users/sboesch/Library/Jupyter/kernels/ir
julia-1.0 /Users/sboesch/Library/Jupyter/kernels/julia-1.0
scala /Users/sboesch/Library/Jupyter/kernels/scala
scijava /Users/sboesch/Library/Jupyter/kernels/scijava
pyspark /usr/local/share/jupyter/kernels/pyspark
spark_scala /usr/local/share/jupyter/kernels/spark_scala
Давайте рассмотрим ядро pyspark
:
sudo vim /usr/local/share/jupyter/kernels/pyspark/kernel.json
Особый интерес представляет файл spark
jar:
PYTHONPATH="/shared/spark/python/:/shared/spark/python/lib/py4j-0.10.4-src.zip"
Доступен ли он?
$ll "/shared/spark/python/:/shared/spark/python/lib/py4j-0.10.4-src.zip"
ls: /shared/spark/python/:/shared/spark/python/lib/py4j-0.10.4-src.zip: No such file or directory
Нет, это не так - давайте обновимсяэтот путь:
$ll /shared/spark/python/lib/py4j*
-rw-r--r--@ 1 sboesch wheel 42437 Jun 1 13:49 /shared/spark/python/lib/py4j-0.10.7-src.zip
PYTHONPATH="/shared/spark/python/:/shared/spark/python/lib/py4j-0.10.7-src.zip"
После этого я перезапустил jupyter
и ядро pyspark
работает.