Я запускаю Scala-код, который объединяет данные и выводит вывод на консоль.К сожалению, я получил нулевые значения после групповой операции. Токовый выход:
| Id | Date |Count |
| null | null |35471 |
Я понял, что горлышко бутылки - это точка, когда я группирую данные - когда я пытаюсь использовать столбец, отличный от числового, вывод возвращает нули.Любой совет будет приветствоваться - я потерял часы, чтобы найти решение.
Мой код:
// create schema
val sensorsSchema = new StructType()
.add("SensorId", IntegerType)
.add("Timestamp", TimestampType)
.add("Value", DoubleType)
.add("State", StringType)
// read streaming data from csv...
// aggregate streaming data
val streamAgg = streamIn
.withColumn("Date", to_date(unix_timestamp($"Timestamp", "dd/MM/yyyy").cast(TimestampType)))
.groupBy("SensorId", "Date")
.count()
// write streaming data...