В сценарии, который вы описали, приемник Flink действительно обработает записи, которые были ранее отправлены ему со времени последнего снимка.
Но это не обязательно означает, что внешнее хранилище данных (например, база данных, файловая система или очередь сообщений), подключенная к приемнику, в конечном итоге сохранит эти дубликаты. Flink может предоставить то, что мы иногда называем «сквозными» гарантиями, если приемник поддерживает транзакции или данные записываются идемпотентным способом.
Производитель Flink Kafka и StreamingFileSink примеры приемников, которые могут использовать преимущества транзакций, чтобы избежать дублирования (или несогласованности) результатов.
Ситуация с Cassandra несколько сложнее - см. Документацию - и Flink может предоставить семантику только один раз, если вы используете идемпотентные запросы.