У меня есть таблица кустов с файлами в формате паркета.
Одним из типов данных столбца является карта. Когда я выполняю запрос к обычному столбцу паркета, поскольку он имеет столбчатый формат, он будет получать только строки со значением столбца, поскольку у него есть индекс для этого столбца.
Но получаю ли я такое же преимущество, когда запрашиваю ключ вложенного столбца.
Скажи карту содержит один ключ key1 со значением v1.
Теперь, когда я запрашиваю - выберите count (1) из таблицы, где attr ['key1'] = 'v1'. Будет ли он сканировать целые строки или только строки с attr ['key1'] как v1?
А что лучше для колонки карты - паркет или ORC?
Спасибо