В Spark Streaming, когда источником ввода является файл CSV, и я читаю его через сокет (Java), Dataset<Row>
создается только со столбцом string
, а значение каждой строки содержит каждую отправленную строку через сокет.
Когда я знаю формат каждой строки, например, первые два значения строки csv Strings
, следующее - integer
и т. д., можно объявить мою схему и создать еще одну Dataset<Row>
на основе этой схемы и соответственно разместить данные?
Заранее спасибо.