Azure IotHub для организации потоковой передачи структуры на БД COSMOS (с и с Кафкой) - PullRequest
0 голосов
/ 13 сентября 2018
  1. Для первого сценария я хочу использовать Spark Structured Streaming с Iot Hub на входе и Cosmos DB на выходе. Я использовал следующие разъемы:
    • лазурь-eventhubs-spark_2.11-2.3.2
    • azure-cosmosdb-spark_2.3.0_2.11-1.2.0 (не напрямую с Maven, импорт uber jar

Дело в том, что когда я пытался импортировать мои данные в Cosmos DB, я получал следующую ошибку:

"java.lang.assertionError: Ошибка подтверждения: полученный порядковый номер 1790 не соответствует порядковому номеру запроса 1791"

  1. С Kafka: я попробовал другое решение, используя Iot Hub и Kafka, для использования Kafka в качестве источника в Spark Structured Streaming (вместо коннектора Event Hub). Но после всех настроек, связанных с Кафкой, у меня появляется следующая ошибка:

«Не удалось найти класс, который реализует Connector и имя которого соответствует com.microsoft.azure.iot.kafka.connect.source.IotHubSourceConnector».

Проблема с псевдонимом. Как вы думаете, это связано с тем, что мы используем Iot Hub вместо Event Hub?

=> Я попробую третье решение, которое использует Stream Analytics, чтобы протолкнуть в БД Cosmos, затем реализовать ленту изменений БД Cosmos, чтобы использовать ее в качестве структурированной потоковой передачи Spark в качестве входа. Надеюсь, это сработает.

Любые советы по 2 приведенным выше сценариям приветствуются!

Ответы [ 2 ]

0 голосов
/ 18 сентября 2018

Я работаю с @Tidjoe, и теперь решение работает.

Это разъем, который мы используем:

  • azure-eventhubs-spark_2.11-2.3.4
  • azure-cosmosdb-spark_2.3.0_2.11-1.2.0 (не напрямую с Maven, с помощью import uber jar

Наше решение работает с Eventhub или IotHub на входе.

Спасибо за выпуск!

0 голосов
/ 15 сентября 2018

Для первого сценария: вы можете попробовать версию 2.3.4 (azure-eventhubs-spark_2.11-2.3.4), которая должна решить эту конкретную проблему, как указано здесь командой разработчиков:

https://github.com/Azure/azure-event-hubs-spark/issues/313

и здесь

https://github.com/Azure/azure-event-hubs-spark/pull/384

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...