Формат файла паркета с вложенным типом данных - PullRequest
0 голосов
/ 14 сентября 2018

У меня есть таблица кустов с файлами в формате паркета. Одним из типов данных столбца является карта. Когда я выполняю запрос к обычному столбцу паркета, поскольку он имеет столбчатый формат, он будет получать только строки со значением столбца, поскольку у него есть индекс для этого столбца.

Но получаю ли я такое же преимущество, когда запрашиваю ключ вложенного столбца. Скажи карту содержит один ключ key1 со значением v1. Теперь, когда я запрашиваю - выберите count (1) из таблицы, где attr ['key1'] = 'v1'. Будет ли он сканировать целые строки или только строки с attr ['key1'] как v1?

А что лучше для колонки карты - паркет или ORC?

Спасибо

...