Question

У меня есть поток NiFi, который читает текстовые данные из файлов CSV, выполняет некоторую обработку и затем выводит данные в Kafka в формате JSON. Этап обработки в основном предназначен для дедупликации данных.

Вот схема текущего потока:

Read CSV files ==> Processing (deduplication) ==> Convert to JSON ==> Push to Kafka

Я думаю о преобразовании данных в Avro после их чтения изатем выполните обработку.

Предлагаемый поток будет:

Read CSV files ==> Convert to Avro ==> Processing (deduplication) ==> Convert to JSON ==> Push to Kafka

Может ли это принести какие-либо выгоды или это просто бесполезный промежуточный этап?

Bryan Bende · Answer 1 · 30 октября 2019

Не было бы смысла переходить на Avro. Вы можете настроить PublishKafkaRecord с помощью программы чтения CSV и модуля записи JSON, чтобы перейти прямо из CSV в JSON.

В NiFi, приносит ли преобразование данных в промежуточный формат (avro) какие-либо преимущества, если выходной формат не является Avro?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

В NiFi, приносит ли преобразование данных в промежуточный формат (avro) какие-либо преимущества, если выходной формат не является Avro?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы