Десериализация структуры из формата Kafka avro с функцией from_avro в Spark работает неправильно - PullRequest
0 голосов
/ 21 января 2019

Я использовал to_avro для сериализации поля структуры в dataframe в 'value' и записи в тему kafka.
Моя структура имеет несколько строковых полей.Я проверил и все поля имеют значение.Используя Spark Streaming, я прочитал тему и использую from_avro для десериализации значения с точной схемой, которая использовалась для сериализации структуры.

select(from_avro($"value", schema).as("value")) 

Возвращаемое значение - это поле структуры в результирующем фрейме данных.Тем не менее, всегда есть какое-то поле в структуре без значения.Только некоторые поля имеют правильное значение.
Может ли это быть ошибкой в ​​to_avro / from_avro функциях или я их не правильно использовал?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...