Как отследить предыдущие значения pyspark - PullRequest
0 голосов
/ 10 апреля 2019

Я использую потоковую обработку искры с приемником foreach для обработки данных iot-пакета.

Мне нужно отслеживать время работы устройства, если текущий пакет имеет меньшее время работы, чем предыдущий, необходимо запустить логику.

Я пытался использовать глобальные переменные в Python, но это не сработало из-за параллельных вычислений.Я попытался записать результаты во временную таблицу, но, кажется, невозможно получить доступ к сеансу sparkcontext / spark внутри функции foreach.Любые идеи о том, как поступить, будут оценены.

Заранее спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...