Я пытаюсь прочитать, что таблица HIVE содержит данные за 2 года и разбита на сутки, чтение через SPARK-SQL занимает более 10 минут даже после применения фильтра для данных за 6 месяцев.
ЛюбыеИдея, как улучшить, я пытался с предложением DISTRIBUTE BY в Hive QL