Производительность NiFi с реплицированными распределенными томами - PullRequest
0 голосов
/ 16 марта 2020

Я пытаюсь вставить данные в том, реплицированный в кластере, что влияет на мою скорость обработки и производительности в NiFi.

Когда я пытаюсь выполнить вставку по основному пути c linux с использованием процессора PutFile , Это дает хорошую скорость и производительность (5000 записей / с c)

Но когда я пытаюсь вставить путь, который является точкой монтирования для моего тома с репликацией кластера, используя PutFile Processor.

Он берет 250 файлов из очереди и ждет 2-3 минуты, и только затем принимает следующие 250 файлов через 2 минуты (я установил размер пакета в 2000 в PutF ie (Процессор))

Файлы помещаются в очередь перед процессором putSFTP на долгое время.

Насколько я понимаю, как только он берет 250 файлов, он ожидает 250 файлов, которые будут реплицированы и вставлены во все реплики, и после этого процесса для 250 файлов получают подтверждение только тогда, когда он получает следующие 250 файлов для обработки !!

Есть ли способ отключить процесс подтверждения, что я Он не ждет подтверждения вставки и репликации первых 250 файлов и получения следующих 250 файлов.

Я вижу опцию подтверждения в PutKafka и PutMon go Processor. Пожалуйста, поделитесь, как эта конфигурация может быть реализована для процессора Putfile, вставляющего данные в Gluster !!

2) Какой лучший способ производства запустить и остановить NiFi ??

Через NIFi GUI или Командный скрипт NiFi CLI ??

...