Я хочу ограничить скорость при извлечении данных из кафки.Мой код выглядит так:
df = spark.read.format('kafka') \
.option("kafka.bootstrap.servers",'...')\
.option("subscribe",'A') \
.option("startingOffsets",'''{"A":{"0":200,"1":200,"2":200}}''') \
.option("endingOffsets",'''{"A":{"0":400,"1":400,"2":400}}''') \
.option("maxOffsetsPerTrigger",20) \
.load() \
.cache()
Однако, когда я звоню df.count()
, результат равен 600. Я ожидал, что это 20. Кто-нибудь знает, почему maxOffsetsPerTrigger не работает.