У меня есть требование, где мне нужно прочитать тему Кафки в pyspark и постоянно сравнивать значение текущего чтения rdd с предыдущим rdd из потока. Как этого добиться?