Question

В IMPALA мы можем оптимизировать запросы, создавая таблицы, задавая сортировку файлов по некоторым столбцам, т.е. используя SORT BY при создании таблицы. Это похоже на работу, только если мы используем «INSERT» или «CREATE table with select» для созданиятаблица.

В моем случае я создаю файл паркета извне, используя parquet-cpp, загружаю его в HDFS и затем использую команду IMPALA «LOAD DATA».

 With this mode of loading data into IMPALA is there any way we can use SORT BY mechanism?

Оптимизация запросов IMPALA с использованием статистики паркета

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Оптимизация запросов IMPALA с использованием статистики паркета

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы