Установка spark.sql.codegen.wholeStage = false в pyspark, но все равно получение кода Java, сгенерированного в журналах - PullRequest
0 голосов
/ 01 июля 2019

Я получаю ошибку ниже при разборе файла XML, который имеет 20 уровней вложенности в кластере (работает на локальной машине)

ОШИБКА CodeGenerator : не удалось скомпилировать:

org.codehaus.janino.JaninoRuntimeException: постоянный пул для класса org.apache.spark.sql.catalyst.expressions.GeneratedClass $ SpecificSafeProjection превысил предел JVM, равный 0xFFFF

Чтобы исправить это, я добавил ниже код

--conf spark.sql.codegen.wholeStage=false 

Но я все еще вижу, что код Java генерируется в журналах Spark.Например:

/* 001 */ public java.lang.Object generate(Object[] references) {

Я ожидаю, что ошибка CodeGenerator исчезнет, ​​изменив кодовый код, но это не происходит.Хотя config присутствует в команде spark submit, но я все еще вижу код Java .

В основном моя цель - проанализировать большой файл XML.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...