Хороший вопрос!
Откройте файл bashrc и введите export SPARK_OPTS="--packages graphframes:graphframes:0.5.0-spark2.1-s_2.11"
. После сохранения файла bashrc закройте его и введите source .bashrc
.
Наконец, откройте свой блокнот и введите:
from pyspark import SparkContext
sc = SparkContext()
sc.addPyFile('/home/username/spark-2.3.0-bin-hadoop2.7/jars/graphframes-0.5.0-spark2.1-s_2.11.jar')
После этого вы можете запустить его.