Как читать файлы CSV с кафкой? - PullRequest
0 голосов
/ 05 апреля 2019

Я хочу потоковую передачу CSV-файлов на спарк с kafka.

Все файлы сохраняются в формате hdf другим сервисом, и я хотел бы прочитать все файлы, используя kafka. Нечто похожее на то, что делается с потоковым искром:

 val event1 = spark
   .readStream
   .schema(test_raw)
   .option("newFilesOnly", "true")
   .option("header", "true") 
   .option("sep", ",") 
   .csv(stream_path)

1 Ответ

0 голосов
/ 05 апреля 2019

Разъем, который вы ищете, может быть таким: https://github.com/jcustenborder/kafka-connect-spooldir

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...