Создать индекс для таблиц в Delta Lake - PullRequest
0 голосов
/ 23 октября 2019

Я новичок в Delta Lake, но я хочу создать несколько индексов для быстрого поиска для некоторых таблиц в Delta Lake. Основываясь на документах, он показывает, что самым близким является создание пропуска данных и индексация пропущенной части:

create DATASKIPPING index on [TableName] [DBName.]tableName

Не удается найти другие методы создания индексов, кроме пропуска данных

Как мне создать индексы, как и любые таблицы в РСУБД, в Delta Lake?

Спасибо!

1 Ответ

0 голосов
/ 28 октября 2019

Индексирование происходит автоматически на Databricks Delta . При записи данных столбцы в записываемых файлах индексируются и добавляются во внутренние метаданные таблицы. При запросе данных и фильтрации применяется пропуск данных.

Кроме того, вы можете использовать z-order для оптимизации файлов на основе определенных столбцов. И снова индексирование будет использоваться и для других столбцов.

...