Оптимизаторы запросов обычно используют сводки распределений данных для оценки размеров промежуточных таблиц, сгенерированных во время обработки запросов. Одной из популярных таких схем суммирования является гистограмма, согласно которой входной диапазон разбивается на сегменты, и поддерживается кумулятивный подсчет количества кортежей, попадающих в каждый сегмент. Распределение в ведре считается равномерным для целей оценки.
Ниже показана одна такая гистограмма для отношения R
на дискретном атрибуте a с доменом [1..10]
:
Bucket 1: range = [1..2] Cumulative tuple count = 6
Bucket 2: range = [3..8] Cumulative tuple count = 30
Bucket 3: range = [9..10] Cumulative tuple count = 10
Каков примерный размер операции самостоятельного объединения R x R
A) 46
B) 218
C) 248
D) 1,036
E) 5,672
Ответ дан в решениях: B
Как рассчитать ответ?