Хотелось бы узнать производительность соединения Кассандры в спарк.
В данном сценарии:
У меня есть источник кафки
У меня есть таблица cassandra
Я хочу соединить источник kafka с таблицей cassandra с помощью ключа разделения.
Запустит ли 1 удаленный вызов от исполнителя к кассете за запись в источнике kafka, в любом из следующих примеров?
В случае, когда я использую:
RddFunctions.leftJoinWithCassandraTable.
Структурированная потоковая передача.И я создаю набор данных из Кассандры и Кафки и присоединяюсь к ним.