Как генерировать таблицы параллельно с тестом tpc-ds? - PullRequest
0 голосов
/ 17 июня 2019

Как запустить генерацию данных tpc-ds (dsdgen), а затем выполнить запросы к этим данным (dsqgen) в параллельном распределенном режиме.Я использую Spark для настройки пряжи (spark.master yarn) и храню данные в системе хранения с импульсным буфером.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...