Question

Я хочу потоковую передачу CSV-файлов на спарк с kafka.

Все файлы сохраняются в формате hdf другим сервисом, и я хотел бы прочитать все файлы, используя kafka. Нечто похожее на то, что делается с потоковым искром:

 val event1 = spark
   .readStream
   .schema(test_raw)
   .option("newFilesOnly", "true")
   .option("header", "true") 
   .option("sep", ",") 
   .csv(stream_path)

Ismail H · Answer 1 · 05 апреля 2019

Разъем, который вы ищете, может быть таким: https://github.com/jcustenborder/kafka-connect-spooldir

Как читать файлы CSV с кафкой?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как читать файлы CSV с кафкой?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы