Вопрос, на который я пытаюсь ответить:
Создать RDD
Используйте карту для создания RDD массивов NumPy, указанных в столбцах.Имя RDD будет Rows
Мой код: Rows = df.select(col).rdd.map(make_array)
После того, как я наберу это, я получаю странную ошибку, которая в основном говорит: Исключение: Python in worker имеет другую версию 2.7чем в драйвере 3.6, PySpark не может работать с другими второстепенными версиями.Пожалуйста, проверьте, правильно ли установлены переменные окружения PYSPARK_PYTHON и PYSPARK_DRIVER_PYTHON.
![enter image description here](https://i.stack.imgur.com/IqqSR.png)
Я знаю, что работаю в среде с Python 3.6.Я не уверен, что эта конкретная строка кода вызывает эту ошибку?Как вы думаете
Просто заметьте, это не первая строка кода на этом ноутбуке Jupyter.Если вам нужна дополнительная информация, пожалуйста, дайте мне знать, и я предоставлю ее.Я не могу понять, почему это происходит.