Использование библиотеки производителя Kinesis в Spark - PullRequest
0 голосов
/ 04 января 2019

У меня Spark job читает миллионы записей с Кассандры, отфильтровывает (бизнес-правила) и записывает в поток Kinesis.Я не нашел ни одного примера и отзыва о том, как вызвать KPL (Kinesis Producer Library) из Spark.Это правильный подход?Есть ли у меня другой вариант?

1 Ответ

0 голосов
/ 06 августа 2019

вы можете создать производителя KPL для каждого раздела, а затем для каждого раздела вы можете отправить сообщение.Держите разделы небольшими, чтобы избежать перегрузки узлов задачи / ядра.

...