ведение в неравном соединении в улье - PullRequest
1 голос
/ 18 июня 2019

В настоящее время улей поддерживает неэквивалентное соединение.Но так как перекрестный продукт становится довольно огромным, мне стало интересно, какие есть варианты для объединения больших таблиц измерений (257 миллиардов строк, 37 ТБ) и сравнительно небольших (8,7 ГБ).

В случае равныхобъединение Я могу легко сделать это с помощью правильного объединения столбцов / столбцов соединения.(используя то же количество сегментов для SMBM, практически преобразующих в соединение карт).Но если мы думаем, что это не будет иметь никакого преимущества, когда это неравное объединение, потому что значения будут присутствовать в других сегментах, практически вызывая случайное перемешивание, то есть фазу сокращения.

Если у кого-то есть мысли, которые нужно преодолетьэто, пожалуйста, предложите .....

1 Ответ

0 голосов
/ 19 июня 2019

Если таблица измерений помещается в памяти, вы можете создать пользовательскую пользовательскую функцию (UDF), как указано здесь , и выполнить неравное соединение в памяти.

...