Являются ли Spark Streaming, Structured Streaming и Kafka Streaming одинаковыми? - PullRequest
0 голосов
/ 07 февраля 2019

Я сталкивался с тремя популярными потоковыми техниками, такими как Spark Streaming, Structured Streaming и Kafka Streaming.Я прошел через различные сайты, но не получил этот ответ, это три одинаковые или разные?Если не то же самое, в чем заключается основное отличие.Я не ищу подробного ответа.Но ответ на поставленный выше вопрос (да или нет) и небольшое вступление к каждому из них, чтобы я мог исследовать больше.:)

Заранее спасибо Субрат

1 Ответ

0 голосов
/ 07 февраля 2019

Я полагаю, вы имеете в виду Kafka Streams, когда говорите "Поток Kafka".

Kafka Streams - это библиотека JVM, часть Apache Kafka.Это способ обработки данных в темах Kafka, обеспечивающий уровень абстракции.Приложения с библиотекой KafkaStreams могут запускаться где угодно (не только в кластере Kafka, на самом деле это не рекомендуется).Они будут потреблять, обрабатывать и выдавать данные в / из кластера Kafka.

Spark Streaming является частью библиотеки распределенной обработки данных Apache Spark, которая обеспечивает потоковую (в отличие от пакетной) обработку.Первоначально Spark предоставлял только пакетные вычисления, поэтому для обработки потока был предоставлен определенный уровень Spark Streaming.Spark Streaming может передаваться с данными Kafka, но также может быть подключен и к другим источникам.

Structured Streaming, в рамках Apache Spark, - это другой подход, позволяющий преодолеть определенные ограничения в обработке потоков.предыдущего подхода, который использовался Spark Streaming.Он был добавлен в Spark с определенной версии (2.0 IIRC).

...