Question

df.select($"onenews".getItem(1), $"onenews").show(5,false)

результат показывает следующее: значение поля getItem (1) неверно, и столбец "onenews", который я получил, взят из разделенных строк.

Я знаю причину, это из-за ленивых вычислений spark, столбец onenews вычисляется из функции, которая содержит случайное перемешивание.

Satish Karuturi · Answer 1 · 26 октября 2018

Я не совсем понял ваш вопрос, согласно моему пониманию, если вы хотите извлечь 0-й элемент из столбца onenews, вам нужно использовать getItem (0) вместо getItem (1).

образец кода:

df.select(df.col("onenews").getItem(0)).show()

Искра DataFrame выбрать один элемент из массива, но значение не является правильным

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Искра DataFrame выбрать один элемент из массива, но значение не является правильным

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов