Question

Я пытаюсь прочитать, что таблица HIVE содержит данные за 2 года и разбита на сутки, чтение через SPARK-SQL занимает более 10 минут даже после применения фильтра для данных за 6 месяцев.

ЛюбыеИдея, как улучшить, я пытался с предложением DISTRIBUTE BY в Hive QL

Strick · Answer 1 · 09 октября 2019

Вы можете включить отсечение разделов, установив свойство:

spark.sql.hive.metastorePartitionPruning=true

Это отфильтрует разделы

Чтение секционированной таблицы HIVE в SQL SPARK

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Чтение секционированной таблицы HIVE в SQL SPARK

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы