Я использую Google Colab Laboratory, чтобы по какой-то причине узнать о Pyspark при запуске настроенной среды. Я получаю сообщение об ошибке, которое, по-видимому, возникает при переходе с одного ноутбука на другой.
сообщение об ошибке: IndexError Traceback(последний вызов был последним) в () 4 5 импорт findspark ----> 6 findspark.init () 7 из pyspark import SparkContext 8 sc = SparkContext.getOrCreate ()
/usr/local/lib/python3.6/dist-packages/findspark.py in init(spark_home,
python_path, edit_rc, edit_profile)
133 # add pyspark to sys.path
134 spark_python = os.path.join(spark_home, 'python')
--> 135 py4j = glob(os.path.join(spark_python, 'lib', 'py4j-*.zip'))
[0]
136 sys.path[:0] = [spark_python, py4j]
137
IndexError: list index out of range
Код, предоставленныйGoogle для настройки env
import os
os.environ["JAVA_HOME"] = "/usr/lib/jvm/java-8-openjdk-amd64"
os.environ["SPARK_HOME"] = "/content/spark-2.3.1-bin-hadoop2.7"
import findspark
findspark.init()
from pyspark import SparkContext
sc = SparkContext.getOrCreate()
import pyspark
from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
spark