Недостаток выбора транзакции_даты в качестве столбца раздела: (1) Слишком маленькие каталоги, которые могут вызывать издержки в HDFS.
Преимущества использования состояния: (1) Количество каталогов будет фиксированным.
Все зависит от того, как будет сформирован запрос для выполнения.Если ваш запрос содержит условие фильтра для транзакции_даты, а раздел отсутствует, то общее выполнение будет медленным.
Кроме того, создание раздела не гарантирует более быстрого выполнения.Результаты поиска будут возвращаться быстрее для разделов, объем данных которых меньше, чем для разделов, объем данных которых большой.