Spark dataframe не будет отображаться () - Py4JJavaError: Произошла ошибка при вызове o426.showString - PullRequest
0 голосов
/ 06 декабря 2018

У меня есть фрейм данных, который я не могу .show ().Каждый раз это дает следующую ошибку?Возможно ли наличие поврежденного столбца?

Ошибка:

Py4JJavaError: Произошла ошибка при вызове o426.showString.: org.apache.spark.SparkException: задание прервано из-за сбоя этапа: задание 0 на этапе 381.0 не выполнено 4 раза, последний сбой: потерянное задание 0.3 на этапе 381.0 (TID 19204, ddlps28.rsc.dwo.com, исполнитель 99): org.apache.spark.api.python.PythonException: обратная связь (последний вызов был последним): файл "/opt/cloudera/parcels/SPARK2-2.2.0.cloudera1-1.cdh5.12.0.p0.142354/lib/spark2 / python / pyspark / worker.py ", строка 177, в основном

1 Ответ

0 голосов
/ 06 декабря 2018

Скорее всего, ваша ошибка не в операции "show".Это то, что .show запускает выполнение вашего DAG.Вы сказали, что это работает, если вы не запускаете UDF, возможно, у вас просто другая ошибка в этом UDF.Журнал, вероятно, будет на рабочих узлах, поэтому попробуйте получить доступ через пользовательский интерфейс Hadoop, чтобы получить доступ к журналам исполнителя, чтобы увидеть, что действительно нарушает

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...