Как подписаться на определенный раздел и читать из пользовательского смещения в Spark Structured Streaming? - PullRequest
0 голосов
/ 12 декабря 2018

У меня есть вариант использования, когда несколько таблиц публикуются в одной теме, но в разных разделах.Я хочу читать из определенного раздела в одиночку и из пользовательского смещения.

 val data = sql.readStream.format("kafka")
      .option("kafka.bootstrap.servers", "servers")
      .option("assign", {"TEST1":[0]})
      .option("startingOffsets",""" {"TEST1":{"0":172260244}} """)
      .option("endingOffsets",""" {"TEST1":{"0":-1}} """)
      .load()

Итак, когда я подписываюсь на него, я получаю следующую ошибку.Название темы конвертируется в нижний регистр автоматически.

WARN org.apache.spark.sql.kafka010.KafkaSource  - Error in attempt 1 getting Kafka offsets: 
java.lang.AssertionError: assertion failed: If startingOffsets contains specific offsets, you must specify all TopicPartitions.
Use -1 for latest, -2 for earliest, if you don't care.
Specified: Set(test1-0) Assigned: Set(TEST1-0)

1 Ответ

0 голосов
/ 13 декабря 2018

Разобрался с проблемой.Исправлена ​​ошибка с обновлением библиотек Spark до более поздних версий.

https://issues.apache.org/jira/browse/SPARK-19853

...