Question

Я создал фрейм данных из файла CSV. Он имеет 10 столбцов, две из которых - актриса и название фильма. Я хочу сделать актрису ключом, а название - ценностью, а затем хочу уменьшить ее ключ, чтобы получить список фильмов для каждой актрисы. В этом случае я должен сначала сопоставить столбец актрисы с заголовком фильма. Итак, как получить кортежи актрисы, пары «ключ-значение» в «Spark scala». Кроме того, я хочу сделать это с использованием основных операций, а не SparkSQL.

Chitral Verma · Answer 1 · 11 мая 2018

Предложение: Низкое качество вопроса, вы должны сначала найти примеры в Интернете, а затем

val df = ???

val moviesByActressDF = df.groupBy("actress_col")
.agg(collect_list("movie_col"))

Надеюсь, это поможет, ура

Как отобразить один столбец данных в другой столбец в Apache Spark Scala?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как отобразить один столбец данных в другой столбец в Apache Spark Scala?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов