Question

Я пытаюсь сделать извлечение информации из Spark SQL.При создании извлечения отображается следующее сообщение об ошибке.

[Симба] [Выносливое] (35) Ошибка сервера: код ошибки: «0» сообщение об ошибке: «org.apache.spark.SparkException: задание прерваноиз-за сбоя этапа: общий размер сериализованных результатов 906 задач (4,0 ГБ) больше, чем spark.driver.maxResultSize (4,0 ГБ) '.

thebluephantom · Answer 1 · 04 июня 2019

Не совсем убежден в Spark SQL Thrift Server, и немного неловко излагать все факты. Tableau использует полученные результаты для драйвера, как еще он может получить их с помощью Spark?

Тем не менее:

Установка spark.driver.maxResultSize 0 в соответствующем файле spark-thrift-sparkconf.conf будет означать отсутствие ограничений (кроме физических ограничений на узле драйвера).
Установите значение spark.driver.maxResultSize 8G или выше в соответствующем файле spark-thrift-sparkconf.conf. Обратите внимание, что не вся память на драйвере может быть использована.
Или используйте Impala Connection for Tableau, предполагая источник Hive Impala, тогда меньше таких проблем.

Кроме того, количество одновременных пользователей может быть проблемой. Отсюда последний пункт.

Интересно, если не сказать больше.

big_mike_boiii · Answer 2 · 31 мая 2019

Быстрое исправление - это просто изменение настроек в контексте выполнения.

spark.sql("set spark.driver.maxResultSize = 8G")

Невозможно создать экстракт - Таблицы и Spark SQL

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Невозможно создать экстракт - Таблицы и Spark SQL

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы