У меня есть поток событий (формат ниже), который мне нужно проанализировать в spark (java). Я могу прочитать поток, но не смог найти пример для преобразования сообщения в java bean.
{
user_id : string,
session_id : string,
event : string,
page : string,
timestamp : timestamp
}
Java Bean
public class Event implements Serializable {
private String user_id;
private String session_id;
private String page;
private String event;
private Timestamp timestamp;
}
Код читать сообщение как String.
Dataset<String> lines = spark
.readStream()
.format("kafka")
.option("kafka.bootstrap.servers", "localhost:9092")
.option("subscribe", topics)
.load()
.selectExpr("CAST(value AS STRING)")
.as(Encoders.STRING());