Друидский паркет плохая производительность при приеме внутрь - PullRequest
0 голосов
/ 07 февраля 2019

Есть ли причины, по которым прием Друида должен быть медленным при приеме данных с паркета?Мы наблюдали, что скорость приема по крайней мере в 2 раза лучше, когда данные JSON были загружены.В общем, какой из них лучше?JSON или Паркет в контексте периодического приема друида Hadoop.

1 Ответ

0 голосов
/ 07 февраля 2019

Паркет оптимизирован для парадигмы WORM.Это медленно, но невероятно быстро, особенно когда вы получаете доступ только к подмножеству общих столбцов.Поскольку формат данных паркета сжимается и кодируется, поэтому запись происходит медленнее по сравнению с форматом данных JSON.

Здесь вы можете пойти на компромисс с производительностью приема данных в формате паркета, но для анализа данных это невероятно быстро из-за его столбчатых данных.формат.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...