Могу ли я постепенно обновлять набор данных в Spark Structured Streaming? - PullRequest
0 голосов
/ 04 марта 2019

Мне нужен набор данных из запроса к базе данных (источник данных JDBC), который содержит все строки, которые новее определенной временной отметки (например, select * from TABLE where created_at > ?).Но мне нужно, чтобы это обновлялось для каждой входящей микропакета. В идеале, я бы хотел каждый раз вносить изменения в набор данных, но одновременно сохранять максимум n строк (в отличие от перезагрузки всего набора данных каждый раз).время).Таким образом, я могу просто получить строки таблицы, которые были добавлены с момента последнего поиска.

Есть ли способ достичь этого (или что-то похожее) в Spark Structured Streaming?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...