Azure потоковая аналитика с позицией входного потока концентратора событий - PullRequest
0 голосов
/ 16 июня 2020

Настройка

Я использую потоковую аналитику Azure для потоковой передачи данных в промежуточную таблицу хранилища Azure. Источником ввода задания является поток EventHub. Когда я обновляю задание, я замечаю, что объем невыполненных заданий по входным событиям значительно увеличивается после запуска. Похоже, что задание снова начинает обрабатывать всю очередь EventHub с самого начала.

Вопросы

  • как организовано управление позициями в потоке в потоковой аналитике можно определить позицию в потоке, где начинается задание (например, событие после постановки в очередь после указанного c момента времени)

Пока сделано

Я заметил аналогичный вопрос здесь, на StackOverflow . Упоминается имя переменной «eventStartTime». Но поскольку я использую проект «asaproj» в Visual Studio для создания, обновления и развертывания задания, я не знаю, где разместить его перед развертыванием.

1 Ответ

0 голосов
/ 30 июня 2020

Для обновления задания без остановки, он будет использовать предыдущую настройку «Joboutputstarttime», поэтому при запуске задания можно обрабатывать данные с самого начала.

вы можете сначала остановить задание, а затем выбрать " Joboutputstarttime "перед тем, как приступить к работе. enter image description here

You can reference this document https://docs.microsoft.com/en-us/azure/stream-analytics/start-job, чтобы просмотреть подробную информацию для каждого режима. для вашего сценария режим «Когда последний раз остановлен» может быть тот, который вам нужен, и он не будет обрабатывать данные с начала очереди концентратора событий.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...