Вы можете попробовать использовать Record Oriented
процессоры, т.е. PublishKafkaRecord_1.0
процессор.
Так что ваш поток будет:
1.ListFile
2.FetchFile
3.PublishKafkaRecord_1.0 //Configure with more than one concurrent task
Используя этот поток, мы не собираемся использовать процессоры SplitText
и определить службы контроллеров RecordReader/Writer
в* Процессор 1014 *.
In addition
Вы также можете распределить нагрузку, используя Remote Process Groups
Поток:
1.ListFile
2.RemoteProcessGroup
3.FetchFile
4.PublishKafkaRecord_1.0 //In scheduling tab keep more than one concurrent task
См. эту ссылку для получения более подробной информации о проектировании / настройке вышеуказанного потока.
Начиная с версии NiFi-1.8нам не нужно использовать RemoteProcessGroup
(для распределения нагрузки), поскольку мы можем настроить соединения (взаимосвязи) для распределения балансировки нагрузки.
См. эти и NiFi-5516 ссылки для более подробной информации об этих new additions
в версии NiFi-1.8.