Hive - разница между подсказкой Streamtable и хранением данных в буфере (in_memory) - PullRequest
0 голосов
/ 16 октября 2018

Я понимаю, что по умолчанию куст куста направляет самую правую таблицу в запросе, которую можно переопределить, используя / * + STREAMTABLE (имя таблицы) * /, которая передает данные в поток вместо сохранения их в памяти.В идеале большие таблицы передаются в потоковом режиме, чтобы избежать буфера при обработке памяти.

Вопрос, который у меня возникает, заключается в том, как подсказка таблицы потоков работает внутренне, т. Е. Как избежать загрузки данных в память и выполнять намного более быстрые операции?

...