Я довольно новичок в потоковом программировании.У нас есть Kafka Stream, который использует Avro.
Я хочу подключить Kafka Stream к Spark Stream.Я использовал приведенный ниже код.
kvs = KafkaUtils.createDirectStream(ssc, [topic], {"metadata.broker.list": brokers})
lines = kvs.map(lambda x: x[1])
Я получил приведенную ниже ошибку.
return Файл s.decode ('utf-8') "/usr/lib64/python2.7/encodings / utf_8.py ", строка 16, в декодировании возвращает codecs.utf_8_decode (input, errors, True) UnicodeDecodeError: кодек utf8 не может декодировать байты в позиции 57-58: недопустимый байт продолжения
Нужно ли указывать, что Кафка использует Avro. Выше ошибки для этого?Если это так, как я могу это указать?