Уменьшение значения max.spout.pending приводит к сбоям сообщений в Kafka Spout в Storm UI? - PullRequest
0 голосов
/ 14 сентября 2018

Мы пытаемся оценить производительность в нашей топологии Storm. Мы принимаем сообщения около 1000 в секунду в тему Кафки. Когда мы помещаем max.spout.pendind = 2000 в наш KafkaSpout, тогда мы не видим никаких сбойных сообщений в штормовом интерфейсе, но когда мы уменьшаем значение max.spout.pendind до 500 или 100, тогда мы видим много сбойных сообщений в spout в штормовом интерфейсе. Насколько я понимаю, если мы сохраняем значение max.spout.pending на низком уровне, у нас не будет никаких сообщений о сбоях, поскольку ничто не прекратит работу, но оно будет вести себя противоположным образом. Мы используем версию Storm 1.1.0 из версии HDP 2.6.5.

У нас есть один излив Kafka и два болта.

KafkaSpout Parallelism               - 1
Processing Bolt Parallelism          - 1
Custom Kafka Writer Bolt Parallelism - 1

Может ли кто-нибудь иметь представление об этом?

Ответы [ 3 ]

0 голосов
/ 19 сентября 2018

Ниже приведены статистические данные по топологии:

Topology Summary Topology resources Topology actions Spouts(all time) enter image description here

0 голосов
/ 26 сентября 2018

Это интересно.Вы правы, следуйте моим инструкциям, чтобы сузить проблему,

  1. Загрузить скриншот экрана визуализации топологии при кратковременной нагрузке.
  2. Проверьте, чтобы болты меняли свой цвет накоричневый / красный.Красный цвет означает, что вашему болту требуется слишком много времени для обработки записей.
  3. Ваши исполнители изливов / болтов обрабатывают намного меньше 1K кортежей в секунду.
  4. Количество машин, которые вы используете?
  5. Если в «KafkaSpout» произошел сбой кортежей, то в большинстве случаев это означает ошибку тайм-аута.
  6. Узнайте, после обработки, сколько кортежей событий дает сбой.
0 голосов
/ 15 сентября 2018

Первое, что вам нужно будет сделать, - в штормовом интерфейсе проверить статистику задержки.Вы также должны посмотреть, как загружаются болты / носики (статистика емкости).Действительно ли скорость выброса кортежей действительно высока по сравнению со скоростью утечки этих данных?, Это признак того, что я получаю, когда вы упоминаете, что увеличение ожидающих носиков решает проблему.Можете ли вы предоставить эту статистику? Другая часть, заслуживающая изучения, - это увеличение времени выполнения задачи для кортежей (чтобы выяснить, не вызывает ли это воспроизведение и не затопляет ли топология)

...