Это пакетный процесс Кафки. Я хочу прочитать локальный CSV-файл и записать его в топик Кафки c.
Затем потребитель должен получить данные из топи c, на которые он подписан.
Ожидается : Я хочу, чтобы использованные данные были добавлены в файл в формате Parquet в HDFS. Пожалуйста, помогите мне добиться этого эффективным способом.
Кафка Вход производителя: 
Кафка Потребительский выпуск: 
Я хочу, чтобы значение добавлялось в файл в HDFS.