StackOverFlow Ошибка при запуске алгоритма дерева FP в Pyspark - PullRequest
0 голосов
/ 06 января 2020

Я использую pyspark для генерации Association Rules с использованием FP Growth Algorithm в Jupyter Notebook. Я установил память водителя и исполнителя на 40 Гб. У меня работает спарк в режиме клиента. Каждый раз, когда этап «8» и задача «11» терпят неудачу, и это ошибка:

ERROR Executor: Exception in task 11.0 in stage 8.0 (TID 821) java.lang.StackOverflowError

Мои входные данные имеют размер 1,2 ГБ. Будем благодарны за любые советы о том, как решить эту проблему.

...