Question

Рассмотрим таблицу орков в улье с разделом в столбце dt_month, в котором содержатся все строки дней в месяце (txn_dt).

Сокращение раздела будет работать, когда я, когда я введу предложение where непосредственно на dt_month, как показано ниже.

df = spark.table("table")
df.where("dt_month = '2018-01-01'")

Но есть ли возможность для меня собирать статистику на уровне разделов и обрезать разделы при фильтрации на txn_dt (это столбец, из которого происходит dt_month), потому что есть некоторые переходные свойства, к которым это относится столбец раздела?

df = spark.table("table")
df.where("txn_dt = '2018-01-01'")

Можем ли мы сделать так, чтобы этот запрос не проходил по всей таблице и опирался на индексы orc, а только на раздел 2018-01-01, а затем использовал индекс orc?

Обрезка разделов на основе других столбцов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Обрезка разделов на основе других столбцов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов