Спарк-отправить файл Python и получить модуль не найден - PullRequest
0 голосов
/ 25 января 2019
 spark-submit --master yarn-cluster --deploy-mode cluster test.py

заканчивается ошибка

import pandas as pd ImportError: Нет модуля с именем pandas

это единственная ошибка, которую я вижу.

с использованием дистрибутива Anaconda Python 2.7 PYSPARK_VENV]/lib/python2.7/site-packages/ в локации есть панды.

1 Ответ

0 голосов
/ 25 января 2019

Вы можете проверить, установлены ли панды в папке [PYSPARK_VENV] /lib/python2.7/site-packages/.Похоже, вы выполняете приложение pyspark на другом интерпретаторе python.Убедитесь, что вы установили пакет pandas для этого интерпретатора.

Вы можете использовать Anaconda для управления пакетами python в этих ситуациях knida.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...