Как добавить вывод потребителя кафки в файл (паркет) в HDFS, используя Java / Scala? - PullRequest
0 голосов
/ 05 марта 2020

Это пакетный процесс Кафки. Я хочу прочитать локальный CSV-файл и записать его в топик Кафки c.

Затем потребитель должен получить данные из топи c, на которые он подписан.

Ожидается : Я хочу, чтобы использованные данные были добавлены в файл в формате Parquet в HDFS. Пожалуйста, помогите мне добиться этого эффективным способом.

Кафка Вход производителя: enter image description here

Кафка Потребительский выпуск: enter image description here

Я хочу, чтобы значение добавлялось в файл в HDFS.

1 Ответ

0 голосов
/ 05 марта 2020

Сделать это с нуля было бы довольно сложно.

Вы можете использовать HDFS-коннектор Kafka для подключения приемника, который обрабатывает выходной формат в виде паркетного короба (хотя для этого потребуется немного предварительно обработать ваши записи). они в правильном формате, например json со схемой и c ..).

Более подробная информация здесь: https://docs.confluent.io/current/connect/kafka-connect-hdfs/index.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...