df.select($"onenews".getItem(1), $"onenews").show(5,false)
результат показывает следующее: значение поля getItem (1) неверно, и столбец "onenews", который я получил, взят из разделенных строк.
![enter image description here](https://i.stack.imgur.com/Kmm5M.png)
Я знаю причину, это из-за ленивых вычислений spark, столбец onenews вычисляется из функции, которая содержит случайное перемешивание.