У меня есть приложение, которое получает твиты из топики Kafka c, имеет окно в одну секунду, а затем сохраняет эти твиты на Cassandra с помощью операции AssyncIO, которая позволяет открыть максимум 100 потоков (последний параметр оператора AsyncIO ) без какой-либо предварительной обработки данных: просто сохраняйте твиты по твитам с отметкой времени, когда они были сохранены.
Затем я подчеркнул, что приложение Flink отправило 3 миллиона твитов, и сделал график в Grafana, который показывает, сколько твитов сохраняется в базе данных, но этот график показывает некоторые выборки, не является непрерывной линией, и Я не могу понять почему.
Таким образом, вы можете видеть, что с интервалом в одну минуту он экономит 7к, затем переходит к 5к, а затем, например, к 2к. Буду признателен за любую помощь в попытке выяснить, почему! Большое спасибо!