Могу ли я запустить Apache Drill на Raspberry Pi и узнать физическую стоимость плана запроса? - PullRequest
0 голосов
/ 06 декабря 2018

Я смотрел это видео об Apache Drill (https://www.youtube.com/watch?time_continue=14&v=0rurIzOkTIg)), в котором говорится, что я могу установить DrillBit на узлы моего кластера, и механизм Drill оценит наилучший физический план для выполнения запроса. Затем я смогу запустить explain plan для запроса (https://drill.apache.org/docs/query-plans/), и я увижу, где детализация приняла решение об обработке локальных данных в памяти или нет, а также о других решениях по стоимости. Это еще одна ссылка, которую я читала ( Apache Drill vs Spark ).

Я также вижу, что Drill имеет плагин для файловых систем. Поэтому я представляю, что могу установить Drill на 3 компьютера и запросить на них файлы журналов.

Интересно, возможно ли это?установить Drill на Raspberry Pi, которые имеют различные соединения (проводные, беспроводные, радио, ...) и выполнить запрос к файлам журналов, расположенных на этих Pis. Это также цель Drill?

1 Ответ

0 голосов
/ 07 декабря 2018

Drill может действительно запрашивать файлы журналов из разных хранилищ, но я не уверен, что спецификации Raspberry Pi соответствуют требованиям ресурсов Drill:

Память по умолчанию для Drillbit - 8G, но Drill предпочитает 16G илибольше в зависимости от рабочей нагрузки

https://drill.apache.org/docs/configuring-drill-memory/

В любом случае, возможно выполнить сверло на машине с меньшим объемом памяти, но этого будет недостаточно для обработкибольшие наборы данных.

...