Flink прочитал данные из oop и опубликовал sh в Кафку - PullRequest
0 голосов
/ 29 апреля 2020

У меня есть требование прочитать данные из HDFS и опубликовать sh их в топике Кафки c. Поскольку они являются частью API-интерфейсов DataSet и DataStream, возможно ли выполнить то, что я ищу, в одной работе?

1 Ответ

1 голос
/ 29 апреля 2020

API Flink DataStream можно использовать для чтения из файлов HDFS. См. readfile() в https://ci.apache.org/projects/flink/flink-docs-stable/dev/datastream_api.html#data -источниках . Или вы можете использовать коннектор файловой системы с API таблиц и SQL, но он поддерживает только CSV.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...