В NiFi, приносит ли преобразование данных в промежуточный формат (avro) какие-либо преимущества, если выходной формат не является Avro? - PullRequest
0 голосов
/ 30 октября 2019

У меня есть поток NiFi, который читает текстовые данные из файлов CSV, выполняет некоторую обработку и затем выводит данные в Kafka в формате JSON. Этап обработки в основном предназначен для дедупликации данных.

Вот схема текущего потока:

Read CSV files ==> Processing (deduplication) ==> Convert to JSON ==> Push to Kafka

Я думаю о преобразовании данных в Avro после их чтения изатем выполните обработку.

Предлагаемый поток будет:

Read CSV files ==> Convert to Avro ==> Processing (deduplication) ==> Convert to JSON ==> Push to Kafka

Может ли это принести какие-либо выгоды или это просто бесполезный промежуточный этап?

1 Ответ

0 голосов
/ 30 октября 2019

Не было бы смысла переходить на Avro. Вы можете настроить PublishKafkaRecord с помощью программы чтения CSV и модуля записи JSON, чтобы перейти прямо из CSV в JSON.

...