Проверка схемы в структурированном потоке - PullRequest
0 голосов
/ 08 июня 2018

У меня есть тема на Кафке, которую я потребляю, и я использую from_json для преобразования сообщения JSON в кадр данных, и я использую структурированную потоковую передачу.

val agentStringDF = spark
      .readStream
      .format("kafka")
      .option("subscribe", "testTopic")
      .option("startingOffsets" , "latest")
      .load()

val df = agentStringDF.select(from_json(col("value").cast("string"), testTopicSchema).alias("testTopic"))

Есть ли способсделать какой-либо тип с from_json, чтобы в случае сбоя регистрировать ошибку и переходить к следующему микропакету?

Я видел случаи проверки схемы после ее преобразования ... но ничего не проверялосьв этом случае.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...