Как уменьшить большие различия в производительности в HDFS наменоде - PullRequest
0 голосов
/ 15 июня 2019

У меня возникла серьезная проблема с производительностью во время отклика HDFS namenode (v2.7).В частности, во время пикового трафика мой namenode HDFS перегружен, и некоторые операции DFS, такие как вывод каталога, могут занять много времени, что влияет на время ответа на запрос для моего Presto и других приложений Hadoop.Есть предложения по решению?

1 Ответ

0 голосов
/ 15 июня 2019

Моя команда сталкивалась с подобными проблемами с высокой задержкой Namenode RPC в пиковое время ранее.Мы использовали многоуровневую архитектуру для решения проблем.Чтобы быть более конкретным, у нас есть большой, интенсивно используемый кластер Hadoop (десятки тысяч узлов), и вокруг него мы имеем меньшие вычислительные кластеры (около 1 тысячи узлов), работающие в Presto и других различных средах на Alluxio, которые служат в качестве уровня кэширования.в большой кластер HDFS.Таким образом, давление службы данных и метаданных будет значительно защищено развертыванием Alluxio.

Более подробно вы можете посмотреть на эту Strata Presentation .

...