В вашем наборе данных есть NaN
(не число) значений. Вы не можете рассчитать среднее с этими.
Либо вы фильтруете их:
dataframe_final
.filter($"speed".isNotNull())
.select("speed")
.orderBy("id")
.agg(avg("speed"))
.show(1000)
, либо заменяете их на 0
, используя функцию fill
:
dataframe_final
.select("speed")
.na.fill(0)
.agg(avg("speed"))
.show(1000)
Кроме того, вы пытаетесь объединить столбец Vitesse
, а не speed
.